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Description 

[0001] La presente invention est relative a une nouvelle souche de coronavirus associe au syndrome respiratoire aigu 
severe (SRAS), issue d’un prelevement repertorie sous le n° 031589 et preleve a Hanoi (Vietnam), a des molecules 
d’acide nucleique issues de son genome, aux proteines et peptides codes par lesdites molecules d’acide nucleique ainsi 
qu’a leurs applications, notamment en tant que reactifs de diagnostic et/ou comme vaccin. 

[0002] Le coronavirus est un virus a ARN monocatenaire, de polarite positive, d'approximativement 30 kilobases qui 
se replique dans le cytoplasme des cellules hotes ; I’extremite 5' du genome a une structure en coiffe et I'extremite 3’ 
comporte une queue polyA. Ce virus est enveloppe et comprend, a sa surface, des structures peplomeriques denommees 
spicules. 

[0003] Le genome comprend les cadres ouverts de lecture ou ORF suivants, de son extremite 5’ vers son extremite 
3’: ORFIa et ORFIb correspondant aux proteines du complexe de transcription-replication, et ORF-S, ORF-E, ORF- 
M et ORF-N correspondant aux proteines structurales S, E, M et N. II comprend egalement des ORFs correspondant 
a des proteines de fonction inconnue codees par: la region situee entre I’ORF-S et I’ORF-E et chevauchant cette 
derniere, la region situee entre I’ORF-M et I’ORF-N, et la region incluse dans I’ORF-N. 

[0004] La proteine S est une glycoproteine membranaire (200-220 kDa) qui se presente sous la forme de spicules ou 
"Spike" emergeant de la surface de I’enveloppe virale. Elle est responsable de I’attachement du virus aux recepteurs 
de la cellule hote et de I’induction de la fusion de I’enveloppe virale avec la membrane cellulaire. 

[0005] La petite proteine d'enveloppe (E) egalement denommee sM ( small membrane) qui est une proteine trans- 
membranaire non glycosylee d’environ 10 kDa, est la proteine presente en plus faible quantite dans le virion. Elle joue 
un role moteur dans le processus de bourgeonnement des coronavirus qui se produit au niveau du compartiment 
intermediaire dans le reticulum endoplasmique et I’appareil de Golgi 

[0006] La proteine M ou proteine de matrice (25-30 kDa) est une glycoproteine membranaire plus abondante qui est 
integree dans la particule virale par une interaction M/E, tandis que I’incorporation de S dans les particules est dirigee 
par une interaction S/M. Elle semble etre importante pour la maturation virale des coronavirus et pour la determination 
du site au niveau duquel les particules virales sont assemblies. 

[0007] La proteine N ou proteine de nucleocapside (45-50 kDa) qui est la plus conservee parmi les proteines struc¬ 
turales des coronavirus, est necessaire pour encapsider I’ARN genomique puis pour diriger son incorporation dans le 
virion. Cette proteine est vraisemblablement egalement impliquee dans la replication de I’ARN. 

[0008] Lorsqu’une cellule hote est infectee, le cadre de lecture (ORF) situe en 5’ du genome viral est traduit en une 
polyproteine qui est clivee par les proteases virales et libere alors plusieurs proteines non-structurales telles que I’ARN- 
polymerase ARN dependante (Rep) et I’ATPase helicase (Hel). Ces deux proteines sont impliquees dans la replication 
du genome viral ainsi que dans la generation de transcrits qui sont utilises dans la synthese des proteines virales. Les 
mecanismes par lesquels ces ARNms sub-genomiques sont produits, ne sont pas completement compris ; cependant 
des faits recents indiquent que les sequences de regulation de la transcription a I’extremite 5’ de chaque gene represented 
des signaux qui regulent la transcription discontinue des ARNms sub-genomiques. 

[0009] Les proteines de la membrane virale (proteines S, E et M) sont inserees dans le compartiment intermediaire, 
alors que I’ARN replique (brin +) s'assemble avec la proteine N (nucleocapside). Ce complexe proteine-ARN s’associe 
ensuite avec la proteine M incluse dans les membranes du reticulum endoplasmique et les particules virales se forment 
lorsque le complexe de la nucleocapside bourgeonne dans le reticulum endoplasmique. Le virus migre ensuite a travers 
le complexe du Golgi et eventuellement sort de la cellule, par exemple par exocytose. Le site de I’attachement du virus 
a la cellule hote se trouve au niveau de la proteine S. 

[0010] Les coronavirus sont responsables de 15 a 30 % des rhumes chez I’Homme et d'infections respiratoires ou 
digestives chez les animaux, notamment le chat (FIPV : Feline infectious peritonitis virus), la volaille (IBV : Avian Infec¬ 
tious bronchitis virus), la souris (MHV : Mouse Hepatitis virus), le pore (TGEV : Transmissible gastroenterititis virus, 
PEDV : Porcine Epidemic Diarrhea virus, PRCoV : Porcine Respiratory Coronavirus, HEV : Hemagglutinating ence¬ 
phalomyelitis Virus) et les bovins (BcoV : Bovine coronavirus). 

[0011] En general, chaque coronavirus n’affecte qu’une seule espece ; chez les individus immunocompetents, I’in- 
fection induit des anticorps eventuellement neutralisants et une immunite cellulaire, capables de detruire les cellules 
infectees. 

[0012] Une epidemie de pneumonie atypique, denommee syndrome respiratoire aigu severe (SARS ou Severe acute 
respiratory syndrome, SRAS en frangais) s’est propagee dans differents pays (Vietnam, Hong-Kong, Singapour, Thai'lan- 
de et Canada) au cours du premier trimestre 2003, a partir d’un foyer initial apparu en Chine dans le dernier trimestre 
de 2002. La severite de cette maladie est telle que son taux de mortalite est d’environ 3 a 6 %. La determination de 
I’agent causatif de cette maladie a ete entreprise par de nombreux laboratoires, a travers le monde. 

[0013] En mars 2003, un nouveau coronavirus (SARS-CoV, SARS virus ou virus SRAS, en frangais) a ete isole, en 
association avec des cas de syndrome respiratoire aigu severe (T.G.KSIAZEK et al., The New England Journal of 
Medicine, 2003, 348, 1319-1330 ; C. DROSTEN et al., The New England Journal of Medicine, 2003, 348, 1967-1976 ; 
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Peiris et al., Lancet, 2003, 361, 1319-). 

[0014] Des sequences genomiques de ce nouveau coronavirus ont ainsi ete obtenues, notamment celles de I’isolat 
Urbani (Genbank n° d'acces AY274119.3 et A. MARRA et al., Science, May 1,2003, 300, 1399-1404) et de I’isolat de 
Toronto (Tor2, Genbank n° d’acces AY 278741 et A. ROTAetal., Science, 2003, 300, 1394-1399). 

[0015] L’organisation du genome est comparable a celle des autres coronavirus connus permettant ainsi de confirmer 
I’appartenance du SARS-CoV a la famille des Coronaviridae ; les cadres ouverts de lecture ORFIa et 1b et les cadres 
ouverts de lecture correspondant aux proteines S, E, M, et N, ainsi qu’a des proteines codees par: la region situee entre 
I’ORF-S et I’ORF-E (ORF3), la region situee entre I’ORF-S et I’ORF-E et chevauchant I’ORF-E (ORF4), la region situee 
entre I’ORF-M et I’ORF-N (ORF7 a ORF11) et la region correspondant a I’ORF-N (ORF13 et ORF14), ont notamment 
ete identifies. 

[0016] Sept differences ont ete mises en evidence entre les sequences des isolats Tor2 et Urbani; 3 correspondent 
a des mutations silencieuses (c/ten position 16622 et a/g en position 19064 de I’ORFIb, t/c en position 24872 de I’ORF- 
S) et 4 modifient la sequence en acides amines de respectivement: les proteines codees par I’ORFIa (c/t en position 
7919 correspondant a la mutation A/V), la proteine S (g/t en position 23220 correspondant a la mutation A/S), la proteine 
codee par l’ORF3 (a/g en position 25298 correspondant a la mutation R/G) et de la proteine M (t/c en position 26857 
correspondant a la mutation S/P). 

[0017] En outre, I’analyse phylogenetique montre que le SARS-CoV est eloigne des autres coronavirus et qu’il est 
apparu, ni par mutation de coronavirus respiratoires humains, ni par recombinaison entre des coronavirus connus (pour 
une revue, voir Holmes, J.C.I., 2003, 111, 1605-1609). 

[0018] La mise en evidence et la prise en compte de nouveaux variants sont importantes pour la mise au point de 
reactifs de detection et de diagnostic du SRAS suffisamment sensibles et specifiques ainsi qu’a des compositions 
immunogenes aptes a proteger des populations contre des epidemies de SRAS. 

[0019] Les Inventeurs ont maintenant mis en evidence une autre souche de coronavirus associe au SRAS, qui se 
distingue des isolats Tor2 et Urbani. 

[0020] La presente invention a done pour objet, une souche isolee ou purifiee de coronavirus humain associe au 
syndrome respiratoire aigu severe, caracterisee en ce que son genome presente sous la forme d’ADN complementaire 
un codon serine en position 23220-23222 du gene de la proteine S ou un codon glycine en position 25298-25300 du 
gene de l’ORF3, et un codon alanine en position 7918-7920 de I’ORFIa ou un codon serine en position 26857-26859 
du gene de la proteine M, lesdites positions etant indiquees en reference a la sequence Genbank AY274119.3. 

[0021] Selon un mode de realisation avantageux de ladite souche, I’equivalent ADN de son genome presente une 
sequence correspondant a la sequence SEQ ID NO : 1 ; cette souche de coronavirus est issue du prelevement de 
lavage bronchoalveolaire d’un patient atteint de SRAS, repertorie sous le n° 031589 et effectue a I’hopital frangais de 
Hanoi (Vietnam). 

[0022] Conformement a I’invention, ladite sequence SEQ ID NO :1 est celle de I’acide desoxyribonucleique corres¬ 
pondant a la molecule d’acide ribonucleique du genome de la souche isolee de coronavirus telle que definie ci-dessus. 
[0023] La sequence SEQ ID NO : 1 se distingue de la sequence Genbank AY274119.3 (isolat Tor2) en ce qu’elle 
possede les mutations suivantes : 

g/t en position 23220 ; le codon alanine (get) en position 577 de la sequence en acides amines de la proteine S de 
Tor2 est remplace par un codon serine (tet), 

a/g en position 25298 ; le codon arginine (aga) en position 11 de la sequence en acide amines de la proteine codee 
par l’ORF3 de Tor 2 est remplace par un codon glycine (gga). 

[0024] En outre, la sequence SEQ ID NO : 1 se distingue de la sequence Genbank AY278741 (isolat Urbani) en ce 
qu’elle possede les mutations suivantes : 

t/c en position 7919 ; le codon valine (gtt) en position 2552 de la sequence en acides amines de la proteine codee 
par I’ORFIa est remplace par un codon alanine (get), 

t/c en position 16622 : cette mutation ne modifie pas la sequence en acides amines des proteines codees par 
I’ORFIb (mutation silencieuse), 

g/a en position 19064 : cette mutation ne modifie pas la sequence en acides amines des proteines codees par 
I’ORFIb (mutation silencieuse), 

c/t en position 24872 : cette mutation ne modifie pas la sequence en acides amines de la proteine S, et 

c/t en position 26857 : le codon proline (ccc) en position 154 de la sequence en acides amines de la proteine M est 

remplace par un codon serine (tcc). 

[0025] En I’absence de mention particuliere, les positions des sequences nucleotidiques et peptidiques sont indiquees 
en reference a la sequence Genbank AY274119.3. 
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[0026] La presente invention a egalement pour objet un polynucleotide isole ou purifie, caracterise en ce que sa 
sequence est celle du genome de la souche isolee de coronavirus telle que definie ci-dessus. 

[0027] Selon un mode de realisation avantageux dudit polynucleotide il presente la sequence SEQ ID NO : 1. 

[0028] Les Inventeurs decrivent egalement un polynucleotide isole ou purifie, caracterise en ce que sa sequence 
hybride dans des conditions de forte stringence avec la sequence du polynucleotide tel que defini ci-dessus. 

[0029] Les termes « isole ou purifie » signifient modifie « par la main de I’homme » a partir de I’etat naturel ; autrement 
dit si un objet existe dans la nature, il est dit isole ou purifie s’il a ete modifie ou extrait de son environnement naturel 
ou les deux. Par exemple, un polynucleotide ou une proteine/un peptide naturellement present dans un organisme vivant 
n’est ni isole, ni purifie ; en revanche le meme polynucleotide ou proteine /peptide separe des molecules coexistantes 
dans son environnement naturel, obtenu par clonage, amplification et/ou synthese chimique est isole au sens de la 
presente invention. De plus, un polynucleotide ou une proteine/peptide qui est introduit dans un organisme par trans¬ 
formation, manipulation genetique ou par toute autre methode, est« isole » meme s’il est present dans ledit organisme. 
Le terme purifie tel qu’utilise dans la presente invention, signifie que les proteines /peptides selon I’invention sont 
essentiellement libres d’association avec les autres proteines ou polypeptides, comme I’est par exemple le produit purifie 
de la culture de cellules hotes recombinantes ou le produit purifie a partir d’une source non-recombinante. 

[0030] On entend par conditions d’hybridation de forte stringence, des conditions de temperature et de force ionique 
choisies de telle maniere qu’elles permettent le maintien de I’hybridation specifique et selective entre polynucleotides 
complementaires. 

[0031] A titre d’illustration, des conditions de forte stringence aux fins de definir les polynucleotides ci-dessus, sont 
avantageusement les suivantes : I’hybridation ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) prehybridation 
a 42°C pendant 3 heures en tampon phosphate (20 mM pH 7,5) contenant 5 x SSC (1 x SSC correspond a une solution 
0,15 M NaCI + 0, 015 M citrate de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x Denhardt’s, 
5 % de dextran sulfate et 1 % d’ADN de sperme de saumon ; (2) hybridation pendant 20 heures a 42°C suivie de 2 
lavages de 20 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x SSC + 0,1 % SDS. Le 
dernier lavage est pratique en 0,1 x SSC + 0,1 % SDS pendant 30 minutes a 60°C. 

[0032] Les Inventeurs decrivent egalement un fragment representatif du polynucleotide tel que defini ci-dessus, ca¬ 
racterise en ce qu’il est susceptible d’etre obtenu, soit par I’utilisation d’enzymes de restriction dont les sites de recon¬ 
naissance et de coupure sont presents dans ledit polynucleotide tel que defini ci-dessus, soit par amplification a I’aide 
d’amorces oligonucleotidiques specifiques dudit polynucleotide tel que defini ci-dessus, soit par transcription in vitro, 
soit par synthese chimique. 

[0033] Selon un mode de realisation avantageux dudit fragment, il est selectionne dans le groupe constitue par: 
I’ADNc correspondant a au moins un cadre ouvert de lecture (ORF) choisi parmi: ORFIa, ORFIb, ORF-S, ORF-E, 
ORF-M, ORF-N, ORF3, ORF4, ORF7 a ORF11, ORF 13 et ORF 14, et I’ADNc correspondant aux extremites 5’ ou 3’ 
non-codantes dudit polynucleotide. 

[0034] Selon une disposition avantageuse de ce mode de realisation, ledit fragment presente une sequence selec¬ 
tionnee dans le groupe constitue par: 

les sequences SEQ ID NO : 2 et 4 representant I'ADNc correspondant a I’ORF-S qui code pour la proteine S, 
les sequences SEQ ID NO : 13 et 15 representant I'ADNc correspondant a I’ORF-E qui code pour la proteine E, 
les sequences sequence SEQ ID NO: 16 et 18 representant I’ADNc correspondant a I’ORF-M qui code pour la 
proteine M, 

les sequences SEQ ID NO : 36 et 38 representant I’ADNc correspondant a I’ORF-N qui code pour la proteine N, 
les sequences representant les ADNc correspondant respectivement: aux ORFIa et ORFIb (ORFlab, SEQ ID 
NO : 31), aux ORF3 et ORF4 (SEQ ID NO : 7, 8), aux ORF 7 a 11 (SEQ ID NO : 19, 20), a l’ORF13 (SEQ ID NO : 
32) et a I’ORF 14 (SEQ ID NO : 34), et 

les sequences representant les ADNc correspondant respectivement aux extremites 5’(SEQ ID NO : 39 et 72) et 
3’ non-codantes (SEQ ID NO : 40, 73) dudit polynucleotide. 

[0035] Les Inventeurs decrivent egalement un fragment de I’ADNc codant pour la proteine S, tel que defini ci-dessus, 
caracterise en ce qu’il presente une sequence selectionnee dans le groupe constitue par les sequences SEQ ID NO : 
5 et 6 (fragments Sa et Sb). 

[0036] Les Inventeurs decrivent egalement un fragment de I'ADNc correspondant aux ORFIa et ORFIb tel que defini 
ci-dessus, caracterise en ce qu’il presente une sequence selectionnee dans le groupe constitue par les sequences SEQ 
ID NO : 41 a 54 (fragments L0 a L12). 

[0037] Les Inventeurs decrivent egalement un fragment du polynucleotide tel que defini ci dessus, caracterise en ce 
qu’il presente au moins 15 bases ou paires de bases consecutives de la sequence du genome de ladite souche incluant 
au moins une de celles situees en position 7979,16622, 19064, 23220, 24872, 25298 et 26857. De preference, il s’agit 
d’un fragment de 20 a 2500 bases ou paires de bases, de maniere preferee de 20 a 400. 
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[0038] La presente invention a egalement pour objet un fragment du plynucleotide tel que defini ci-dessus, caracterise 
en ce qu’il comprend les ou est constitue des bases ou de paires de bases consecutives des positions 7919 a 23220, 
7919 a 25298, 16622 a 23220, 19064 a 23220, 16622 a 25298,19064 a 25298, 23220 a 24872,23220 a 26857,24872 
a 25298, ou 25298 a 26857. 

[0039] Les Inventeurs decrivent egalement des amorces d’au moins 18 bases aptes a amplifier un fragment du genome 
d’un coronavirus associe au SRAS ou de I’equivalent ADN de celui-ci. 

[0040] Selon un mode de realisation desdites amorces, elles sont selectionnees dans le groupe constitue par: 

la paire d’amorces n° 1 correspondant respectivement aux positions 28507 a 28522 (amorce sens, SEQ ID NO : 
60) et 28774 a 28759 (amorce anti-sens, SEQ ID NO : 61) de la sequence du polynucleotide tel que defini ci-dessus, 
la paire d’amorces n° 2 correspondant respectivement aux positions 28375 a 28390 (amorce sens, SEQ ID NO : 
62) et 28702 a 28687 (amorce anti-sens, SEQ ID NO : 63) de la sequence du polynucleotide tel que defini ci-dessus., 
et 

la paire d'amorces constitute des amorces SEQ ID Nos 55 et 56. 

[0041] Les Inventeurs decrivent egalement une sonde apte a detecter la presence du genome d’un coronavirus associe 
au SRAS ou d’un fragment de celui-ci, caracterisee en ce qu’elle est selectionnee dans le groupe constitue par: les 
fragments tels que definis ci-dessus et les fragments correspondant aux positions suivantes de la sequence du polynu¬ 
cleotide tel que defini ci-dessus : 28561 a 28586,28588 a 28608,28541 a 28563 et 28565 a 28589 (SEQ ID NO : 64 a 67). 
[0042] Les sondes et amorces telles que definies ci-dessus peuvent etre marquees directement ou indirectement par 
un compose radioactif ou non radioactif par des methodes bien connues de I’Homme du Metier, afin d’obtenir un signal 
detectable et/ou quantifiable. Parmi les isotopes radioactifs utilises, on peut citer le 32 P, le 33 P, le 35 S, le 3 H ou l’ 125 l. 
Les entites non radioactives sont selectionnees parmi les ligands tels que la biotine, I’avidine, la streptavidine, la digoxy- 
genine, les haptenes, les colorants, les agents luminescents tels que les agents radioluminescents, chemoluminescents, 
bioluminescents, fluorescents, phosphorescents. 

[0043] Les Inventeurs decrivent des sondes et des amorces marquees derivees des sequences precedentes. 

[0044] De telles sondes et amorces sont utiles pour le diagnostic de I’infection par un coronavirus associe au SRAS. 
[0045] Les Inventeurs decrivent egalement une methode de detection d’un coronavirus associe au SRAS, a partir 
d’un echantillon biologique, laquelle methode est caracterisee en ce qu’elle comprend au moins : 

(a) I’extraction d’acides nucleiques presents dans ledit echantillon biologique, 

(b) I’amplification d’un fragment de I’ORF-N par RT-PCRa I’aide d’une paire d’amorces telle que definie ci-dessus, et 

(c) la detection par tout moyen approprie des produits d'amplifications obtenus en (b). 

[0046] Les produits d’amplifications (amplicons) en (b) sont de 268 pb pour la paire d’amorces n° 1 et de 328 pb pour 
la paire d’amorces n°2. 

[0047] Selon un mode de mise en oeuvre avantageux dudit procede, I’etape (c) de detection est realisee a I’aide d’au 
moins une sonde correspondant aux positions 28561 a 28586, 28588 a 28608, 28541 a 28563 et 28565 a 28589 de la 
sequence du polynucleotide tel que defini ci-dessus. 

[0048] De preference, le genome du coronavirus associe au SRAS est detecte et eventuellement quantifie par PCR 
en temps reel, a I’aide de la paire d’amorces n°2 et des sondes correspondant aux positions 28541 a 28563 et 28565 
a 28589 marquees avec des composes differents, notamment des agents fluorescents differents. 

[0049] La RT-PCR en temps reel qui met en oeuvre cette paire d’amorces et cette sonde est tres sensible puisqu'elle 
permet de detecter 10 2 copies d’ARN et jusqu’a 10 copies d’ARN, elle est en outre fiable et reproductible. 

[0050] Les Inventeurs decrivent des polydesoxyribonucleotides et des poly-ribonucleotides simple-brin, double-brin 
et tripe-brin correspondant a la sequence du genome de la souche isolee de coronavirus et de ses fragments tels que 
definis ci-dessus, ainsi qu’a leurs sequences complementaires, sens ou anti-sens, notamment les ARN et les ADNc 
correspondant a la sequence du genome et de ses fragments tels que definis ci-dessus. 

[0051] Les Inventeurs decrivent egalement des fragments d’amplification obtenus a I’aide d’amorces specifiques du 
genome de la souche purifiee ou isolee tel que defini ci-dessus, notamment a I’aide d’amorces et de paires d'amorces 
telles que definies ci-dessus, des fragments de restriction constitues par ou comprenant la sequence des fragments 
tels que definis ci-dessus, des fragments obtenus par transcription in vitro a partir d’un vecteur contenant la sequence 
SEQ ID NO : 1 ou un fragment tel que defini ci-dessus, ainsi que des fragments obtenus par synthese chimique. Des 
exemples de fragments de restriction sont deduits de la carte de restriction de la sequence SEQ ID NO : 1 illustree par 
la figure 13. Lesdits fragments sont, soit sous forme de fragments isoles, soit sous forme de melanges de fragments. 
Les Inventeurs decrivent egalement des fragments modifies, par rapport aux precedents, par enlevement, ou addition 
de nucleotides dans une proportion d'environ 15 %, par rapport a la longueur des fragments ci-dessus et/ou modifies 
au niveau de la nature des nucleotides, des lors que les fragments nucleotidiques modifies conservent une capacite 
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d’hybridation avec les sequences d’ARN genomiques ou antigenomiques de I’isolat tel que defini ci-dessus. 

[0052] Les molecules d’acide nucleique telles que definies ci-dessus sont obtenues par les methodes classiques, 
connues en elles-memes, en suivant les protocoles standards tels que ceux decrits dans Current Protocols in Molecular 
Biology (Frederick M. AUSUBEL,2000, Wiley and son Inc, Library of Congress, USA). Parexemple, elles peuventetre 
obtenues par amplification d’une sequence nucleique par PCR ou RT-PCR ou bien par synthese chimique totale ou 
partielle. 

[0053] Les Inventeurs decrivent egalement une puce ou filtre a ADN ou a ARN, caracterise en ce qu’il comprend au 
moins un polynucleotide ou I’un de ses fragments tels que definis ci-dessus. 

[0054] Les puces ou filtres a ADN ou a ARN tels que definis ci-dessus sont prepares par les methodes classiques, 
connues en elles-memes, comme par exemple greffage chimique ou electrochimique d’oligonucleotides sur support de 
verre ou de nylon. 

[0055] Les Inventeurs decrivent egalement un vecteur de clonage et/ou d’expression recombinant, notamment un 
plasmide, un virus, un vecteur viral ou un phage comprenant un fragment d'acide nucleique tel que defini ci-dessus. De 
preference, ledit vecteur recombinant est un vecteur d’expression dans lequel ledit fragment d’acide nucleique est place 
sous le controle d’elements regulateurs de la transcription et de la traduction appropries. En outre, ledit vecteur peut 
comprendre des sequences (etiquettes ou tag) fusionnees en phase avec I’extremite 5’ et/ou 3’ dudit insert, utiles pour 
I’immobilisation, et/ou la detection et/ou la purification de la proteine exprimee a partir dudit vecteur. 

[0056] Ces vecteurs sont construits et introduits dans des cellules hotes par les methodes classiques d’ADN recom¬ 
binant et de genie genetique, qui sont connues en elles-memes. De nombreux vecteurs dans lesquels on peut inserer 
une molecule d’acide nucleique d’interet afin de I’introduire et de la maintenir dans une cellule hote, sont connus en 
eux-memes ; le choix d'un vecteur approprie depend de I’utilisation envisagee pour ce vecteur (par exemple replication 
de la sequence d’interet, expression de cette sequence, maintien de la sequence sous forme extrachromosomique ou 
bien integration dans le materiel chromosomique de I’hote), ainsi que de la nature de la cellule hote. 

[0057] Ledit plasmide est notamment selectionne parmi les plasmides suivants : 

le plasmide, denomme SARS-S, compris dans la souche bacterienne deposee sous le n° 1-3059, le 20 juin 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient la sequence d’ADNc codant pour la proteine S de la souche de SARS-CoV issue du prelevement 
repertorie sous le n° 031589, laquelle sequence correspondant aux nucleotides des positions 21406 a 25348 (SEQ 
ID NO : 4), en reference a la sequence Genbank AY274119.3, 

le plasmide, denomme SARS-S1, compris dans la souche bacterienne deposee sous le n° 1-3020, le 12 mai 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient un fragment 5' de la sequence d'ADNc codant pour la proteine S de la souche de SARS-CoV issue 
du prelevement repertorie sous le n° 031589, telle que definie ci-dessus, lequel fragment correspondant aux nu¬ 
cleotides des positions 21406 a 23454 (SEQ ID NO :5), en reference a la sequence Genbank AY274119.3 Tor2, 
le plasmide, denomme SARS-S2, compris dans la souche bacterienne deposee sous le n° 1-3019, le 12 mai 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient un fragment 3'de la sequence d’ADNc codant pour la proteine S de la souche de SARS-CoV issue 
du prelevement repertorie sous le n° 031589, telle que definie ci-dessus, lequel fragment correspondant aux nu¬ 
cleotides des positions 23322 a 25348 (SEQ ID NO :6), en reference a la sequence Genbank n° d’acces AY274119.3, 
le plasmide, denomme SARS-SE, compris dans la souche bacterienne deposee sous le n° 1-3126, le, 13 novembre 
2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15; il contient I’ADNc correspondant a la region situee entre I’ORF-S et I’ORF-E et chevauchant I’ORF-E de 
la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle 
region correspondant aux nucleotides des positions 25110 a 26244 (SEQ ID NO :8), en reference a la sequence 
Genbank n° d’acces AY274119.3, 

le plasmide, denomme SARS-E, compris dans la souche bacterienne deposee sous le n° 1-3046, le 28 mai 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient la sequence d’ADNc codant pour la proteine E de la souche de SARS-CoV issue du prelevement 
repertorie sous le n° 031589, telle que definie ci-dessus, laquelle sequence correspondant aux nucleotides des 
positions 26082 a 26413 (SEQ ID NO :15), en reference a la sequence Genbank n° d’acces AY274119.3, 
le plasmide, denomme SARS-M ; compris dans la souche bacterienne deposee sous le n° 1-3047, le 28 mai 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient la sequence d’ADNc codant pour la proteine M de la souche de SARS-CoV issue du prelevement 
repertorie sous le n° 031589, telle que definie ci-dessus ; laquelle sequence correspondant aux nucleotides des 
positions 26330 a 27098 (SEQ ID NO :18), en reference a la sequence Genbank n° d’acces AY274119.3, 
le plasmide denomme SARS-MN, compris dans la souche bacterienne deposee sous le n° 1-3125, le 13 novembre 
2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
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Cedex 15 ; il contient la sequence d'ADNc correspondant a la region situee entre I’ORF-M et I'ORF-N de la souche 
de SARS-CoV issue du prelevement repertorie sous le n° 031589 et prelevee a Hanoi, telle que definie ci-dessus, 
laquelle sequence correspondant aux nucleotides des positions 26977 a 28218 (SEQ ID NO :20), en reference a 
la sequence Genbank n° d'acces AY274119.3, 

le plasmide denomme SARS-N, compris dans la souche bacterienne deposee sous le n° 1-3048, le 5 juin 2003, 
aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient I’ADNc codant pour la proteine N de la souche de SARS-CoV issue du prelevement repertorie sous 
le n° 031589, telle que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 28054 a 
29430 (SEQ ID NO :38), en reference a la sequence Genbank n° d'acces AY274119.3 ; ainsi ce plasmide comprend 
un insert de sequence SEQ ID NO :38 et est compris dans une souche bacterienne qui et qu’il a ete deposee sous 
le n° 1-3048, le 5 juin 2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur 
Roux, 75724 Paris Cedex 15, 

le plasmide denomme SARS-5’NC, compris dans la souche bacterienne deposee sous le n° I- 3124, le 7 novembre 
2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient I’ADNc correspondant a I’extremite 5’non codante du genome de la souche de SARS-CoV 
issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle sequence correspondant 
aux nucleotides des positions 1 a 204 (SEQ ID NO :39), en reference a la sequence Genbank n° d'acces AY274119.3, 
le plasmide denomme SARS-3’NC, compris dans la souche bacterienne deposee sous le n° 1-3123 le 7 novembre 
2003, aupres de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15. ; il contient la sequence d'ADNc correspondant a I’extremite 3’non codante du genome de la souche de 
SARS-CoV issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle sequence 
correspondant a celle situee entre le nucleotide en position 28933 a 29727 (SEQ ID NO :40), en reference a la 
sequence Genbank n° d'acces AY274119.3, se termine par une serie de nucleotides a., 

le plasmide d’expression denomme plV2.3N, contenant un fragment d’ADNc codant pour une fusion C-terminale 
de la proteine N (SEQ ID NO : 37) avec une etiquette polyhistidine, 

le plasmide d'expression denomme plV2.3S c , contenant un fragment d’ADNc codant pour une fusion C-terminale 
du fragment correspondant aux positions 475 a 1193 de la sequence en acides amines de la proteine S (SEQ ID 
NO : 3) avec une etiquette polyhistidine, 

le plasmide d’expression plV2.3S L , contenant un fragment d'ADNc codant pour une fusion C-terminale du fragment 
correspondant aux positions 14 a 1193 de la sequence en acides amines de la proteine S (SEQ ID NO : 3) avec 
une etiquette polyhistidine, 

le plasmide d’expression denomme plV2.4N, contenant un fragment d’ADNc codant pour une fusion N-terminale 
de la proteine N (SEQ ID NO : 3) avec une etiquette polyhistidine, 

le plasmide d’expression denomme plV2.4S c ou plV2.4S-|, contenant un insert codant pour une fusion N-terminale 
du fragment correspondant aux positions 475 a 1193 de la sequence en acides amines de la proteine S (SEQ ID 
NO : 3) avec une etiquette polyhistidine, et 

le plasmide d’expression denomme plV2.4S L contenant un fragment d’ADNc codant pour une fusion N-terminale 
du fragment correspondant aux positions 14 a 1193 de la sequence en acides amines de la proteine S (SEQ ID 
NO : 3) avec une etiquette polyhistidine. 

[0058] Selon une disposition avantageuse du plasmide d’expression tel que defini ci-dessus, il est compris dans une 
souche bacterienne qui a ete deposee sous le n° I- 3117, le 23 octobre 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

[0059] Selon une autre disposition avantageuse du plasmide d’expression tel que defini ci-dessus, il est compris dans 
une souche bacterienne qui a ete deposee sous le n° I- 3118, le 23 octobre 2003, aupres de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

[0060] Selon une autre disposition du plasmide d’expression tel que defini ci-dessus, il est compris dans une souche 
bacterienne qui a ete deposee a la CNCM, 25 rue du Docteur Roux, 75724 Paris Cedex 15 sous les numeros suivants : 

a) souche n° I- 3118, deposee le 23 octobre 2003, 

b) souche n° I- 3019, deposee le 12 mai 2003, 

c) souche n° I- 3020, deposee le 12 mai 2003, 

d) souche n°l-3059, deposee le 20 juin 2003, 

e) souche n° 1-3323, deposee le 22 novembre 2004, 

f) souche n° 1-3324, deposee le 22 novembre 2004, 

g) souche n° 1-3326, deposee le 1" decembre 2004, 

h) souche n° 1-3327, deposee le 1 er decembre 2004, 

i) souche n° 1-3332, deposee le 1" decembre 2004, 
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j) souche n° 1-3333, deposee le 1" decembre 2004, 

k) souche n°l-3334, deposee le 1 er decembre 2004, 

l) souche n° 1-3335, deposee le 1 er decembre 2004, 

m) souche n° 1-3336, deposee le 1 er decembre 2004, 

n) souche n° 1-3337, deposee le 1" decembre 2004, 

o) souche n° 1-3338, deposee le 2 decembre 2004, 

p) souche n° 1-3339, deposee le 2 decembre 2004, 

q) souche n° 1-3340, deposee le 2 decembre 2004, 

r) souche n° 1-3341, deposee le 2 decembre 2004. 

[0061] Les Inventeurs decrivent egalement un inserat d’acide nucleique d'origine virale, caracterise en ce qu’il est 
contenu dans I’une quelconque des souches telles que definies ci-dessus en a)-r). 

[0062] Les Inventeurs decrivent egalement un acide nucleique comportant un gene synthetique permettant une ex¬ 
pression optimisee de la proteine S dans des cellules eucaryotes, caracterise en ce qu’il possede la sequence SEQ ID 
NO: 140. 

[0063] Les Inventeurs decrivent egalement un vecteur d'expression comportant un acide nucleique comportant un 
gene synthetique permettant une expression optimisee de la proteine S, lequel vecteur est contenu dans la souche 
bacterienne deposee a la CNCM, le 1 er decembre 2004, sous le n°l-3333. 

[0064] Selon un mode de realisation dudit vecteur d’expression, il s’agit d’un vecteur viral, sous forme de particule 
virale ou sous forme de genome recombinant. 

[0065] Selon une disposition avantageuse de ce mode de realisation, il s’agit d’une particule virale recombinante ou 
d’un genome viral recombinant susceptible d’etre obtenu par transfection d’un plasmide selon les alineas g), h) et k) a 
r) tels que definis ci-dessus, dans un systeme cellulaire approprie, c’est-a-dire, par exemple, des cellules transferees 
avec un ou plusieurs autres plasmide(s), destines a trancomplementer certaines fonctions du virus deletees dans le 
vecteur et necessaires a la formation des particules virales. 

[0066] On entend ici par «famille de la proteine S » la proteine S complete, son ectodomaine et des fragments de 
cet ectodomaine qui sont de preference produits dans un systeme eucaryote. 

[0067] Les Inventeurs decrivent egalement un vecteur lentiviral codant pour un polypeptide de la famille de la proteine 
S, telle que definie ci-dessus. 

[0068] Les Inventeurs decrivent egalement un virus rougeole recombinant codant pour un polypeptide de la famille 
de la proteine S, telle que definie ci-dessus. 

[0069] Les Inventeurs decrivent egalement un virus vaccine recombinant codant pour un polypeptide de la famille de 
la proteine S, telle que definie ci-dessus. 

[0070] Les Inventeurs decrivent egalement I’utilisation d’un vecteur selon les alineas e) a r) tels que definis ci-dessus, 
ou d’un vecteur comportant un gene synthetique de la proteine S, tel que defini ci-dessus, pour la production, en systeme 
eucaryote, de la proteine S du coronavirus associe au SRAS, ou d’un fragment de cette proteine. 

[0071] Les Inventeurs decrivent egalement une methode de production de la proteine S en systeme eucaryote, com¬ 
portant une etape de transfection de cellules eucaryotes en culture par un vecteur choisi parmi les vecteurs contenus 
dans les souches bacteriennes mentionnees aux alineas e) a r) ci-dessus ou un vecteur comportant un gene synthetique 
permettant une expression optimisee de la proteine S. 

[0072] Les Inventeurs decrivent egalement une banque d’ADNc caracterisee en ce qu’elle comprend des fragments 
tels que definis ci-dessus, en particulier des fragments d’amplification ou des fragments de restriction, clones dans un 
vecteur recombinant, notamment un vecteur d’expression (banque d’expression). 

[0073] Les Inventeurs decrivent egalement des cellules, notamment des cellules procaryotes, modifiees par un vecteur 
recombinant tel que defini ci-dessus. 

[0074] Les Inventeurs decrivent egalement une cellule eucaryote genetiquement modifiee exprimant une proteine ou 
un polypeptide tels que definis ci-apres. Bien evidemment, les termes "cellule eucaryote genetiquement modifiee" ne 
designent pas une cellule modifiee par un virus sauvage. 

[0075] Selon un mode de realisation avantageux de ladite cellule, elle est susceptible d’etre obtenue par transfection 
par I’un quelconque des vecteurs mentionnes aux alineas k) a n) ci-dessus. 

[0076] Selon une disposition avantageuse de ce mode de realisation, il s’agit de la cellule FRhK4-Ssol-30, deposee 
a la CNCM le 22 novembre 2004, sous le n°l-3325. 

[0077] Les vecteurs recombinants tels que definis ci-dessus et les cellules transformees par lesdits vecteurs d’ex¬ 
pression sont avantageusement utilises pour la production des proteines et des peptides correspondants. Les banques 
d’expression derivees desdits vecteurs, ainsi que les cellules transformees par lesdites banques d’expression sont 
avantageusement utilisees pour identifier les epitopes immunogenes (epitopes B et T) des proteines du coronavirus 
associe au SRAS. 

[0078] Les Inventeurs decrivent egalement des proteines etdes peptides purifiees ou isolees, caracterises en cequ’ils 
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sont codes par le polynucleotide ou I’un de ses fragments tels que definis ci-dessus. 

[0079] Selon un mode de realisation avantageux, ladite proteine est selectionnee dans le groupe constitue par: 

la proteine S de sequence SEQ ID NO :3 ou son ectodomaine 
la proteine E de sequence SEQ ID NO : 14 
la proteine M de sequence SEQ ID NO :17 
la proteine N de sequence SEQ ID NO : 37 

les proteines codees par les ORFs : ORFIa, ORFIb, ORF3, ORF4 et ORF7 a ORF11, ORF 13 et ORF 14 de 
sequence respectivement, SEQ ID NO :74, 75, 10, 12, 22, 24, 26, 28, 30, 33 et 35. 

[0080] On utilisera ci-apres indifferemment les termes « ectodomaine de la proteine S » et «forme soluble de la 
proteine S ». 

[0081] Selon un mode de realisation avantageux, ledit polypeptide est constitue des acides amines correspondant 
aux positions 1 a 1193 de la sequence en acides amines de la proteine S 

[0082] Selon un autre mode de realisation avantageux, ledit peptide est selectionne dans le groupe constitue par: 

a) les peptides correspondant aux positions 14 a 1193 et 475 a 1193 de la sequence en acides amines de la proteine S, 

b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) et 100 a 221 de la sequence en acides amines 
de la proteine M ; ces peptides correspondent respectivement a I’ectodomaine et a I’endodomaine de la proteine M, et 

c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO : 70) et 53 a 76 (SEQ ID NO : 71) de la sequence 
en acides amines de la proteine E ; ces peptides correspondent respectivement a I'ectodomaine et a I'extremite C- 
terminale de la proteine E, et 

d) les peptides de 5 a 50 acides amines consecutifs, de preference de 10 a 30 acides amines, inclus ou chevauchant 
partiellement ou totalement la sequence des peptides tels que definis en a), b) ou c). 

[0083] Les Inventeurs decrivent egalement un peptide caracterise en ce qu’il presente une sequence de 7 a 50 acides 
amines incluant un residu d’acide amine selectionne dans le groupe constitue par: 

I’alanine situee en position 2552 de la sequence en acides amines de la proteine codee par I’ORFIa. 

la serine situee en position 577 de la sequence en acides amines de la proteine S de la souche de SARS-CoV telle 

que definie ci-dessus, 

la glycine en position 11 de la sequence en acides amines de la proteine codee par l'ORF3 de la souche de SARS- 
CoV telle que definie ci-dessus, 

la serine en position 154 de la sequence en acides amines de la proteine M de la souche de SARS-CoV telle que 
definie ci-dessus. 

[0084] Les Inventeurs decrivent egalement un anticorps ou un fragment d’anticorps polyclonal ou monoclonal, sus¬ 
ceptible d’etre obtenu par immunisation d’un animal avec un vecteur recombinant tel que defini ci-dessus, une banque 
d’ADNc telle que definie ci-dessus ou bien une proteine ou un peptide tels que definis ci-dessus, caracterise en ce qu’il 
se lie avec I’une au moins des proteines codees par le SARS-CoV telles que definies ci-dessus. 

[0085] Les Inventeurs decrivent des anticorps polyclonaux, des anticorps monoclonaux, les anticorps chimeriques 
tels que les anticorps humanises, ainsi que leurs fragments (Fab, Fv, scFv). 

[0086] Les Inventeurs decrivent egalement un hybridome produisant un anticorps monoclonal contre la proteine N, 
caracterise en ce qu’il est choisi parmi les hybridomes suivants : 

I'hybridome produisant I’anticorps monoclonal 87, depose a la CNCM le 1 er decembre 2004 sous le numero 1-3328, 
I’hybridome produisant I’anticorps monoclonal 86, depose a la CNCM le 1 er decembre 2004 sous le numero 1-3329, 
I’hybridome produisant I’anticorps monoclonal 57, depose a la CNCM le 1 er decembre 2004 sous le numero 1-3330, et 
I’hybridome produisant I’anticorps monoclonal 156, depose a la CNCM le 1 er decembre 2004 sous le numero 1-3331. 

[0087] Les Inventeurs decrivent egalement un anticorps ou fragment d’anticorps polyclonal ou monoclonal dirige 
contre la proteine N, caracterise en ce qu’il est produit par un hybridome tel que defini ci-dessus. 

[0088] On entend par anticorps chimerique, relativement a un anticorps d’une espece animale particuliere ou d’une 
classe particuliere d'anticorps, un anticorps comprenant tout ou partie d’une chaine lourde et/ou d’une chaTne legere 
d’un anticorps d’une autre espece animale ou d’une autre classe d'anticorps. 

[0089] On entend paranticorps humanise une immmunoglobuline humainedans laquelle les residus des CDRs ( Com¬ 
plementary-Determining Regions) qui forment le site de liaison a I'antigene sont remplaces par ceux d’un anticorps 
monoclonal non-humain possedant la specificite, I’affinite ou I'activite recherchees. Par comparaison avec les anticorps 
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non-humains, les anticorps humanises sont moins immunogenes et possedent une demi-vie prolongee chez I’Homme 
car ils ne possedent qu’une faible proportion de sequences non-humaines etant donne que la quasi-totalite des residus 
des regions FR (Framework) et de la region constante (Fc) de ces anticorps sont ceux d’une sequence consensus 
d’immunoglobulines humaines. 

[0090] Les Inventeurs decrivent egalement une puce ou filtre a proteine, caracterise en ce qu’il comprend une proteine, 
un peptide ou bien un anticorps tels que definis ci-dessus. 

[0091] Les puces a proteine sont preparees par les methodes classiques, connues en elles-memes. Parmi les supports 
appropries sur lesquels peuvent etre immobilises des proteines, on peut citer ceux en matiere plastique ou en verre, 
notamment sous la forme de microplaques. 

[0092] La presente invention a egalement pour objet des reactifs derives de la souche isolee de coronavirus associe 
au SRAS, issue du prelevement repertorie sous le n° 031589, utiles pour I'etude et le diagnostic de I’infection provoquee 
par un coronavirus associe au SRAS, lesquels reactifs sont selectionnes dans le groupe constitue par une souche isolee 
de coronavirus et un polynucleotide tels que definis ci-dessus. 

[0093] Les Inventeurs decrivent egalement des reactifs derives de la souche isolee de coronavirus associe au SRAS, 
issue du prelevement repertorie sous le n° 031589, utiles pour I’etude et le diagnostic de I'infection provoquee par un 
coronavirus associe au SRAS, lesquels reactifs sont selectionnes dans le groupe constitue par: 

(a) une paire d’amorces, une sonde ou une puce a ADN telles que definies ci-dessus, 

(b) un vecteur recombinant ou une cellule modifiee tels que definis ci-dessus, 

(c) une proteine ou un peptide tel que defini ci-dessus, 

(d) un anticorps ou fragment d’anticorps tels que definis ci-dessus, et 

(e) une puce a proteine telle que definie ci-dessus. 

[0094] Ces differents reactifs sont prepares et utilises selon les techniques classiques de biologie moleculaire et 
d’immunologie, en suivant les protocoles standards tels que ceux decrits dans Current Protocols in Molecular Biology 
(Frederick M. AUSUBEL, 2000, Wiley and Son Inc., Library of Congress, USA), dans Current Protocols in Immunology 
(John E. Cologan, 2000, Wiley and Son Inc. Library of Congress, USA) et dans Antibodies : A Laboratory Manual (E. 
Howell and D Lane, Cold Spring Harbor Laboratory, 1988). 

[0095] Les fragments d'acide nucleique selon I’invention sont prepares et utilises selon les techniques classiques 
telles que definies ci-dessus. Les peptides et les proteines sont prepares par les techniques d ADN recombinant, connues 
de I’Homme du metier, notamment a I’aide des vecteurs recombinants tels que definis ci-dessus. Alternativement, les 
peptides peuvent etre prepares par les techniques classiques de synthese en phase solide ou liquide, connues de 
I’Homme du metier. 

[0096] Les anticorps polyclonaux sont prepares par immunisation d’un animal approprie avec une proteine ou un 
peptide tels que definis ci-dessus, eventuellement couple a la KLH ou a I’albumine et/ou associe a un adjuvant approprie 
tel que I’adjuvant de Freund (complet ou incomplet) ou I’hydroxyde d’alumine ; apres obtention d’un titre en anticorps 
satisfaisant, les anticorps sont recoltes par prelevement du serum des animaux immunises et enrichis en IgG par 
precipitation, selon les techniques classiques, puis les IgG specifiques des proteines du SARS-CoV sont eventuellement 
purifiees par chromatographie d’affinite sur une colonne appropriee sur laquelle sont fixes ledit peptide ou ladite proteine, 
tels que definis ci-dessus, de fagon a obtenir une preparation d’lgG monospecifiques. 

[0097] Les anticorps monoclonaux sont produits a partir d’hybridomes obtenus par fusion de lymphocytes B d'un 
animal immunise par une proteine ou un peptide tels que definis ci-dessus avec des myelomes, selon la technique de 
Kohler et Milstein (Nature, 1975, 256,495-497); les hybridomes sontcultives in vitro, notamment dans des fermenteurs 
ou produits in vivo, sous forme d’ascite ; alternativement lesdits anticorps monoclonaux sont produits par genie genetique 
comme decrit dans le brevet americain US 4,816,567. 

[0098] Les anticorps humanises sont produits par des methodes generates comme celles decrites dans la Demande 
Internationale WO 98/45332. 

[0099] Les fragments d’anticorps sont produits a partir des regions V H et V L donees, a partir des ARNm d’hybridomes 
ou de lymphocytes spleniques d'une souris immunisee ; par exemple, les fragments Fv, scFv ou Fab sont exprimes a 
la surface de phages filamenteux selon la technique de Winter et Milstein (Nature, 1991,349, 293-299); apres plusieurs 
etapes de selection, les fragments d’anticorps specifiques de I’antigene sont isoles et exprimes dans un systeme de¬ 
pression approprie, par les techniques classiques de clonage et d’expression d’ADN recombinant. 

[0100] Les anticorps ou leur fragments tels que definis ci-dessus, sont purifies par les techniques classiques connues 
de I’Homme du metier, telles que la chromatographie d’affinite. 

[0101] La presente invention a en outre pour objet I’utilisation d’un produit selectionne dans le groupe constitue par: 
une souche isolee de coronavirus et un polynucleotide tels que definis ci-dessus, pour la preparation d’un reactif de 
detection et eventuellement de genotypage/serotypage, d’un coronavirus associe au SRAS, 

[0102] Les Inventeurs decrivent en outre I’utilisation d’un produit selectionne dans le groupe constitue par: une paire 
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d’amorces, une sonde, une puce a ADN, un vecteur recombinant, une cellule modifiee, une proteine ou un peptide, un 
anticorps ou un fragment d'anticorps et une puce a proteine tels que definis ci-dessus, pour la preparation d'un reactif 
de detection et eventuellement de genotypage/serotypage, d’un coronavirus associe au SRAS. 

[0103] Les proteines et les peptides, qui sont aptes a etre reconnus et/ou a induire la production d’anticorps specifiques 
du coronavirus associe au SRAS, sont utiles pour le diagnostic de I’infection par un tel coronavirus ; I'infection est 
detectee, par une technique appropriee- notamment EIA, ELISA, RIA, immunofluorescence-, a partir d’un echantillon 
biologique preleve chez un individu susceptible d’etre infecte. 

[0104] Selon une disposition avantageuse de ladite utilisation, lesdites proteines sont selectionnees dans le groupe 
constitue par les proteines S, E, M et/ou N et les peptides tels que definis ci-dessus. 

[0105] Les proteines S, E, M et/ou N et les peptides derives de ces proteines tels que definis ci-dessus, par exemple 
la proteine N, sont utilisees pour le diagnostic indirect d’une infection a coronavirus associe au SRAS (diagnostic 
serologique ; detection d’anticorps specifiques du SARS-CoV), notamment par une methode immunoenzymatique (ELI¬ 
SA). 

[0106] Les anticorps et les fragments d’anticorps tels que definis ci-dessus, notamment ceux diriges contre les pro¬ 
teines S, E, M et/ou N et les peptides derives tels que definis ci-dessus, sont utiles pour le diagnostic direct d’une infection 
a coronavirus associe au SRAS ; la detection de proteine(s) du SARS-CoV est realisee par une technique appropriee, 
notamment EIA, ELISA, RIA, immunofluorescence a partir d’un echantillon biologique preleve chez un individu suscep¬ 
tible d’etre infecte. 

[0107] Les Inventeurs decrivent egalement une methode de detection d’un coronavirus associe au SRAS, a partir 
d’un echantillon biologique, laquelle methode est caracterisee en ce qu’elle comprend au moins : 

(a) la mise en contact dudit echantillon biologique avec au moins un anticorps ou un fragment d’anticorps, une 
proteine, un peptide ou bien une puce ou un filtre a proteine ou a peptide tels que definis ci-dessus, et 

(b) la revelation par tout moyen approprie des complexes antigene-anticorps formes en (a), par exemple par EIA, 
ELISA, RIA, ou par immunofluorescence. 

[0108] Selon un mode de mise en oeuvre avantageux dudit procede I’etape (a) comprend : 

(a.,) la mise en contact dudit echantillon biologique avec au moins un premier anticorps ou un fragment d’anticorps 
qui est fixe sur un support approprie, notamment une microplaque, 

(a 2 ) le lavage de la phase solide, et 

(a 3 ) I’addition d’au moins un second anticorps ou un fragment d’anticorps, different du premier, ledit anticorps ou 
fragment d’anticorps etant eventuellement marque de fagon appropriee. 

[0109] Ce procede qui permet de capturer les particules virales presentes dans I’echantillon biologique est egalement 
denomme procede d’immunocapture. 

[0110] Par exemple: 

I’etape (a-,) est realisee avec au moins un premier anticorps monoclonal ou polyclonal ou un fragment de ceux-ci, 
dirige contre la proteine S, M, et/ou E, et/ou un peptide correspondant a I’ectodomaine de I'une de ces proteines 
(peptides M2-14 ou El-12) 

I’etape (a 3 ) est realisee avec au moins un anticorps ou un fragment d’anticorps dirige contre un autre epitope de la 
meme proteine ou de preference contre une autre proteine, de maniere preferee contre une proteine interne telle 
que la nucleoproteine N ou I’endodomaine de la proteine E ou M, de maniere encore plus preferee il s'agit d’anticorps 
ou de fragments d’anticorps diriges contre la proteine N qui est tres abondante dans la particule virale ; lorsqu’un 
anticorps ou un fragment d’anticorps dirige contre une proteine interne (N) ou contre I’endodomaine des proteines 
E ou M est utilise, le dit anticorps est incube en presence de detergent, comme le Tween 20 par exemple, a des 
concentrations de I’ordre de 0,1 %. 

I’etape (b) de revelation des complexes antigene-anticorps formes est realisee, soit directement a I’aide d’un second 
anticorps marque par exemple avec de la biotine ou une enzyme appropriee telle que la peroxydase ou la phos¬ 
phatase alcaline, soit indirectement a I’aide d'un serum anti-immunoglobulines marque comme ci-dessus. Les com¬ 
plexes ainsi formes sont reveles a I’aide d'un substrat approprie. 

[0111] Selon une mise en oeuvre preferee de cet aspect de I’invention, I’echantillon biologique est melange a I’anticorps 
monoclonal de revelation prealablement a sa mise en contact avec les anticorps monoclonaux de capture. Le cas 
echeant, le melange serum-anticorps de revelation est incube pendant au moins 10 minutes a temperature ambiante 
avant d’etre applique sur la plaque. 

[0112] La presente invention a egalement pourobjet un test d’immunocapture destine a detecter une infection par le 
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coronavirus associe au SRAS par detection de la nucleoproteine native (proteine N), en particulier caracterise en ce 
que I’anticorps utilise pour la capture de la nucleoproteine virale native est un anticorps monoclonal specifique de la 
region centrale et/ou d’un epitope conformationnel. 

[0113] Selon un mode de realisation dudit test, I’anticorps utilise pour la capture de la proteine N est I’anticorps 
monoclonal Acm87, produit par I’hybridome depose a la CNCM le 1 er decembre 2004 sous le numero 1-3328. 

[0114] Selon un autre mode de realisation dudit test d’immunocapture, I’anticorps utilise pour la capture de la proteine 
N est I’anticorps monoclonal Acm86, produit par I’hybridome depose a la CNCM le 1 er decembre 2004 sous le numero 
1-3329. 

[0115] Selon un autre mode de realisation dudit test d'immunocapture, les anticorps monoclonaux Acm86 et Acm87 
sont utilises pour la capture de la proteine N. 

[0116] Dans les tests d’immunocapture selon I'invention, on peut utiliser pour la revelation de la proteine N, I’anticorps 
monoclonal Acm57, produit par I’hybridome depose a la CNCM le 1 er decembre 2004 sous le numero 1-3330, ledit 
anticorps etant conjugue a une molecule ou une particule revelatrice. 

[0117] Conformement audit test d’immunocapture, une combinaison des anticorps Acm57 et Acm87, conjugues a 
une molecule ou une particule revelatrice, est utilisee pour la revelation de la proteine N. 

[0118] Une molecule revelatrice peut etre un atome radioactif, un colorant, une molecule fluorescente, unfluorophore, 
une enzyme ; une particule revelatrice peut etre, par exemple : de I’or colloidal, une particule magnetique ou une bille 
de latex. 

[0119] La presente invention a egalement pour objet un reactif de detection d’un coronavirus associe au SRAS, 
caracterise en ce qu’il est selectionne dans le groupe constitue par une souche isolee de coronavirus telle que definie 
ci-dessus et un polynucleotide tel que defini ci-dessus. 

[0120] Les Inventeurs decrivent egalement un reactif de detection d’un coronavirus associe au SRAS, caracterise en 
ce qu’il est selectionne dans le groupe constitue par: 

(a) une paire d’amorces ou une sonde telles que definies ci-dessus, 

(b) un vecteur recombinant tel que defini ci-dessus ou une cellule modifiee telle que definie ci-dessus, 

(c) un anticorps ou un fragment d’anticorps tel que defini ci-dessus, 

(d) une combinaison d’anticorps comprenant les anticorps monoclonaux Acm86 et/ou Acm87, et I’anticorps mono¬ 
clonal Acm57, telle que definie ci-dessus, 

(e) une puce ou un filtre tels que definis ci-dessus. 

[0121] Les Inventeurs decrivent egalement une methode de detection d'une infection par un coronavirus associe au 
SRAS, a partir d’un echantillon biologique, par ELISA IgG indirect utilisant la proteine N, laquelle methode est caracterisee 
en ce que les plaques sont sensibilisees par une solution de proteine N a une concentration comprise entre 0,5 et 
4p,g/mL, de preference 2|a,g/mL, dans un tampon PBS 10mM pH 7,2, rouge de phenol a 0,25mL IL. 

[0122] Les Inventeurs decrivent, en outre, une methode de detection d’une infection par un coronavirus associe au 
SRAS, a partir d’un echantillon biologique, par ELISA double epitope, caracterisee en ce que le serum a tester est 
melange a I'antigene de revelation, ledit melange etant ensuite mis au contact de I’antigene fixe sur un support solide. 
[0123] Selon une variante des tests de detection des coronavirus associe au SRAS, ces tests combinent un ELSA 
utilisant la proteine N, et un autre ELSA utilisant la proteine S, tel que decrit plus bas. 

[0124] Les Inventeurs decrivent aussi un complexe immun forme d’un anticorps ou d'un fragment d’anticorps polyclonal 
ou monoclonal tel que defini ci-dessus, et d’une proteine ou d’un peptide du coronavirus associe au SRAS. 

[0125] La present invention a en outre pour objet un kit de detection d’un coronavirus associe au SRAS, caracterise 
en ce qu’il comprend au moins un reactif selectionne dans le groupe constitue par une souche isolee de coronavirus et 
un polynucleotide. 

[0126] Les Inventeurs decriventa en outre un kit de detection d’un coronavirus associe au SRAS, caracterise en ce 
qu’il comprend au moins un reactif selectionne dans le groupe constitue par: une paire d’amorces, une sonde, une puce 
a ADN ou a ARN, un vecteur recombinant, une cellule modifiee, une proteine ou un peptide, un anticorps, et une puce 
a proteine tels que definis ci-dessus. 

[0127] Les Inventeurs decrivent en outre, une composition immunogene, caracterisee en ce qu’elle comprend au 
moins un produit selectionne dans le groupe constitue par: 

a) une proteine ou un peptide tels que definis ci-dessus, 

b) un polynucleotide de type ADN ou ARN ou I’un de ses fragments representatifs tels que definis ci-dessus, de 
sequence choisie parmi: 

(i) la sequence SEQ ID NO : 1 ou son equivalent ARN 

(ii) la sequence hybridant dans des conditions de forte stringence avec la sequence SEQ ID NO : 1, 
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(iii) la sequence complementairede la sequence SEQ ID NO : 1 ou de la sequence hybridant dans des conditions 
de forte stringence avec la sequence SEQ ID NO : 1, 

(iv) la sequence nucleotidique d’un fragment representatif du polynucleotide tel que defini en (i), (ii) ou (iii), 

(v) la sequence telle que definie en (i), (ii), (iii) ou (iv), modifiee, et 

c) un vecteur d’expression recombinant comprenant un polynucleotide tel que defini en b), et 

d) une banque d'ADNc telle que definie ci-dessus, 

ladite composition immunogene etant capable d’induire une immunite humorale ou cellulaire protectrice specifique du 
coronavirus associe au SRAS, notamment la production d’un anticorps dirige contre un epitope specifique du coronavirus 
associe au SRAS. 

[0128] Les proteines et les peptides tels que definis ci-dessus, notamment les proteines S, M, E et/ou N et les peptides 
derives, ainsi que les molecules d’acide nucleique (ADN ou ARN) codant lesdites proteines ou lesdits peptides, sont de 
bons candidats vaccin et peuvent etre utilisees dans des compositions immunogenes pour la production d’un vaccin 
contre le coronavirus associe au SRAS. 

[0129] Selon un mode de realisation avantageux des compositions definies ci-dessus, elles contiennent en outre, au 
moins un vehicule pharmaceutiquement acceptable et eventuellement des substances porteuses et/ou des adjuvants. 
[0130] Les vehicules pharmaceutiquement acceptables, les substances porteuses et les adjuvants sont ceux classi- 
quement utilises. 

[0131] Les adjuvants sont avantageusement choisis dans le groupe constitue par des emulsions huileuses, de la 
saponine, des substances minerales, des extraits bacteriens, de I’hydroxyde d’alumine et le squalene. 

[0132] Les substances porteuses sont avantageusement selectionnees dans le groupe constitue par des liposomes 
unilamellaires, des liposomes multilamellaires, des micelles de saponine ou des microspheres solides de nature sac- 
charidique ou aurifere. 

[01 33] Les compositions telles que definies ci-dessus, sont administrees par voie generale, notamment intramusculaire 
ou sous-cutanee ou bien par vote locale notamment nasale (aerosol). 

[0134] Les Inventeurs decrivent egalement I’utilisation d’une proteine ou d'un peptide isole ou purifie presentant une 
sequence selectionnee dans le groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour former un complexe immun avec un anticorps dirige specifiquement contre un 
epitope du coronavirus associe au SRAS. 

[0135] Les Inventeurs decrivent egalement un complexe immun forme d’une proteine ou d’un peptide isole ou purifie 
presentant une sequence selectionnee dans le groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 
24, 26, 28, 30, 33, 35, 37, 69, 70, 71,74 et 75, et d’un anticorps dirige specifiquement contre un epitope du coronavirus 
associe au SRAS. 

[0136] Les Inventeurs decrivent egalement I’utilisation d’une proteine ou d’un peptide isole ou purifie presentant une 
sequence selectionnee dans le groupe constitue par les sequences SEQ ID NO : 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour induire la production d’un anticorps capable de reconnaTtre specifiquement un 
epitope du coronavirus associe au SRAS. 

[0137] Les Inventeurs decrivent egalement I’utilisation d’un polynucleotide isole ou purifie presentant une sequence 
selectionnee dans le groupe constitue par les sequences SEQ ID NO : 1, 2, 4, 7, 8, 13, 15, 16, 18, 19, 20, 31, 36 et 38 
pour induire la production d’un anticorps dirige contre la proteine codee par ledit polynucleotide et capable de reconnaTtre 
specifiquement un epitope du coronavirus associe au SRAS 

[0138] Les Inventeurs decrivent egalement des anticorps monoclonaux reconnaissant la proteine S native d’un coro¬ 
navirus associe au SRAS. 

[0139] Les Inventeurs decrivent egalement I'utilisation d’une proteine ou d’un polypeptide de la famille de la proteine 
S, telle que definie ci-dessus, ou d’un anticorps reconnaissant la proteine S native, tel que defini ci-dessus, pourdetecter 
une infection par un coronavirus associe au SRAS, a partir d’un echantillon biologique. 

[0140] Les Inventeurs decrivent egalement une methode de detection d’une infection par un coronavirus associe au 
SRAS, a partir d'un echantillon biologique, caracterisee en ce que la detection est effectuee par ELISA utilisant la proteine 
S recombinante, exprimee dans un systeme eucaryote. 

[0141] Selon un mode de mise en oeuvre avantageux de ladite methode, il s'agit d’une methode par ELISA double 
epitope, et le serum a tester est melange a I’antigene de revelation, ledit melange etant ensuite mis au contact de 
I’antigene fixe sur un support solide. 

[0142] Les Inventeurs decrivent aussi un complexe immun forme d’un anticorps ou d’un fragment d’anticorps mono¬ 
clonal reconnaissant la proteine S native, et d’une proteine ou d’un peptide du coronavirus associe au SRAS. 

[0143] Les Inventeurs decrivent egalement un complexe immun forme d’une proteine ou d’un polypeptide de la famille 
de la proteine S, telle que definie ci-dessus, et d’un anticorps dirige specifiquement contre un epitope du coronavirus 
associe au SRAS. 
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[0144] Les Inventeurs decrivent en outre un kit ou coffret de detection d’un coronavirus associe au SRAS, caracterise 
en ce qu’il comprend au moins un reactif selectionne dans le groupe constitue par: une proteine ou polypeptide de la 
famille de la proteine S, telle que definie ci-dessus, un acide nucleique codant pour une proteine ou polypeptide de la 
famille de la proteine S, telle que definie ci-dessus, une cellule exprimant une proteine ou polypeptide de la famille de 
la proteine S, telle que definie ci-dessus, ou un anticorps reconnaissant la proteine S native d’un coronavirus associe 
au SRAS. 

[0145] Les Inventeurs decrivent une composition immunogene et/ou vaccinale, caracterisee en ce qu’elle comprend 
un polypeptide ou une proteine recombinante de la famille de la proteine S, telle que definie ci-dessus, obtenu dans un 
systeme d’expression eucaryote. 

[0146] Les Inventeurs decrivent egalement une composition immunogene et/ou vaccinale, caracterisee en ce qu’elle 
comprend un vecteur ou virus recombinant, exprimant une proteine ou un polypeptide de la famille de la proteine S, 
telle que definie ci-dessus. 

[0147] Outre les dispositions qui precedent, I’invention comprend encore d’autres dispositions, qui ressortiront de la 
description qui va suivre, qui se refere a des exemples de mise en oeuvre du polynucleotide representant le genome 
de la souche de SARS-CoV issue du prelevement repertorie sous le numero 031589, et des fragments d’ADNc derives 
objets de la presente invention, ainsi qu’au Tableau I presentant la liste des sequences : 


Tableau I : Liste des sequences 


numero d’identification 

Sequence 

Position de I’ADNc en 

reference a Genbank 

AY274119.3 

Numero de depot a la 
CNCM du plasmide 
correspondant 

SEQ ID NO : 1 

genome de la souche 
issue du prelevement 
031589 



SEQ ID NO : 2 

ORF-S* 

21406-25348 

- 

SEQ ID NO : 3 

Proteine S 

- 

- 

SEQ ID NO : 4 

ORF-S** 

21406-25348 

1-3059 

SEQ ID NO : 5 

fragment Sa 

21406-23454 

1-3020 

SEQ ID NO : 6 

fragment Sb 

23322-25348 

1-3019 

SEQ ID NO : 7 

ORF-3+ORF-4* 

25110-26244 

- 

SEQ ID NO : 8 

ORF-3+ORF-4** 

25110-26244 

1-3126 

SEQ ID NO : 9 

ORF3 

- 

- 

SEQ ID NO : 10 

Proteine ORF-3 

- 

- 

SEQ ID NO : 11 

ORF4 

- 

- 

SEQ ID NO : 12 

Proteine ORF-4 

- 

- 

SEQ ID NO : 13 

ORF-E* 

26082-26413 

- 

SEQ ID NO : 14 

Proteine E 

- 

- 

SEQ ID NO : 15 

ORF-E** 

26082-26413 

1-3046 

SEQ ID NO : 16 

ORF-M* 

26330-27098 

- 

SEQ ID NO : 17 

Proteine M 

- 

- 

SEQ ID NO : 18 

ORF-M** 

26330-27098 

1-3047 

SEQ ID NO : 19 

ORF7 all* 

26977-28218 

- 

SEQ ID NO : 20 

ORF7 all** 

26977-28218 

1-3125 

SEQ ID NO : 21 

ORF7 

- 

- 

SEQ ID NO : 22 

Proteine ORF7 

- 

- 

SEQ ID NO : 23 

ORF8 

- 

- 
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(suite) 


numero d’identification 

Sequence 

Position de I’ADNc en 

reference a Genbank 

AY274119.3 

Numero de depot a la 
CNCM du plasmide 
correspondant 

SEQ ID NO : 24 

Proteine ORF8 

- 

- 

SEQ ID NO : 25 

ORF9 

- 

- 

SEQ ID NO : 26 

Proteine ORF9 

- 

- 

SEQ ID NO : 27 

ORF10 

- 

- 

SEQ ID NO : 28 

Proteine ORF10 

- 

- 

SEQ ID NO : 29 

ORF11 

- 

- 

SEQ ID NO : 30 

Proteine ORF11 

- 

- 

SEQ ID NO: 31 

OrFlab 

265-21485 

- 

SEQ ID NO : 32 

ORF13 

28130-28426 

- 

SEQ ID NO : 33 

Proteine ORF13 

- 

- 

SEQ ID NO : 34 

ORF14 

- 

- 

SEQ ID NO : 35 

Proteine ORF14 

28583-28795 

- 

SEQ ID NO : 36 

ORF-N* 

28054-29430 


SEQ ID NO : 37 

Proteine N 

- 

- 

SEQ ID NO : 38 

ORF-N** 

28054-29430 

1-3048 

SEQ ID NO : 39 

5’non-codante** 

1-204 

1-3124 

SEQ ID NO : 40 

3’non-codante** 

28933-29727 

1-3123 

SEQ ID NO : 41 

ORFlab 

Fragment L0 

30-500 

- 

SEQ ID NO : 42 

Fragment LI 

211-2260 

- 

SEQ ID NO : 43 

Fragment L2 

2136-4187 

- 

SEQ ID NO : 44 

Fragment L3 

3892-5344 

- 

SEQ ID NO : 45 

Fragment L4b 

4932-6043 

- 

SEQ ID NO : 46 

Fragment L4 

5305-7318 

- 

SEQ ID NO : 47 

Fragment L5 

7275-9176 

- 

SEQ ID NO : 48 

Fragment L6 

9032-11086 

- 

SEQ ID NO : 49 

Fragment L7 

10298-12982 

- 

SEQ ID NO : 50 

Fragment L8 

12815-14854 

- 

SEQ ID NO : 51 

Fragment L9 

14745-16646 

- 

SEQ ID NO : 52 

Fragment L10 

16514-18590 

- 

SEQ ID NO : 53 

Fragment L11 

18500-20602 

- 

SEQ ID NO : 54 

Fragment L12 

20319-22224 

- 

SEQ ID NO : 55 

Amorce N sens 

- 

- 

SEQ ID NO : 56 

Amorce N antisens 

- 

- 

SEQ ID NO : 57 

Amorce S c sens 

- 

- 

SEQ ID NO : 58 

Amorce S L sens 

- 

- 

SEQ ID NO : 59 

Amorce S c e t S L antisens 

- 

- 
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(suite) 


numero d’identification 

Sequence 

Position de I’ADNc en 

reference a Genbank 

AY274119.3 

Numero de depot a la 
CNCM du plasmide 
correspondent 

SEQ ID NO : 60 

Amorce sens serie 1 

28507-28522 

- 

SEQ ID NO : 61 

Amorce antisens serie 1 

28774-28759 


SEQ ID NO : 62 

Amorce sens serie 2 

28375-28390 

- 

SEQ ID NO : 63 

Amorce antisens serie 2 

28702-28687 

- 

SEQ ID NO : 64 

Sonde 1/serie 1 

28561-28586 

- 

SEQ ID NO : 65 

Sonde 2/serie 1 

28588-28608 

- 

SEQ ID NO : 66 

Sonde 1/serie 2 

28541-28563 

- 

SEQ ID NO : 67 

Sonde 2/serie 2 

28565-28589 

- 

SEQ ID NO : 68 

Amorce ancre 14T 



SEQ ID NO : 69 

Peptide M2-14 

- 

- 

SEQ ID NO : 70 

Peptide El-12 

- 

- 

SEQ ID NO : 71 

Peptide E53-76 

- 

- 

SEQ ID NO : 72 

5’non-codante* 

1-204 

- 

SEQ ID NO: 73 

3’non-codante* 

28933-29727 

- 

SEQ ID NO : 74 

Proteine ORFIa 

- 

- 

SEQ ID NO : 75 

Proteine ORFIb 

- 

- 

SEQ ID NO:76-139 

Amorces 



SEQ ID NO:140 

Pseudogene de S 



SEQ ID NO:141-148 

amorces 



SEQ ID NO:149 

Aal-13 de S 



SEQ ID NO:150 

polypeptide 



SEQ ID NO:151-158 

amorces 



















* produit d’amplification PCR (amplicon) 

** insert clone dans le plasmide depose a la CNCM 
ainsi qu’aux dessins annexes dans lesquels : 


la figure 1 illustre I’analyse par Western-blot de I’expression in vitro des proteines recombinantes N, S c etS L a partir 
des vecteurs d’expression pIVEX. Piste 1 : plV2.3N. Piste 2 : plV2.3S c . Piste 3 : plV2.3S L . Piste 4 : plV2.4N. Piste 
5 : plV2.4S 1 ou plV2.4S c . Piste 6 : plV2.4S L . L’expression de la proteine GFP exprimee a partir du meme vecteur 
est utilisee comme controle. 

la figure 2 illustre I’analyse par electrophorese en gel de polyacrylamide en conditions denaturantes (SDS-PAGE) 
et coloration au bleu de Coomassie, de I’expression in vivo de la proteine N a partir des vecteurs d’expression 
pIVEX. La souche d’E.co//BL21(DE3)pDIA17 transformee paries vecteurs pIVEX recombinants est cultivee a 30°C 
dans du milieu LB, en presence ou en I’absence d’inducteur (IPTG ImM). Piste 1 : plV2.3N Piste 2 : plV2.4N. 
la figure 3 illustre I’analyse par electrophorese en gel de polyacrylamide en conditions denaturantes (SDS-PAGE) 
et coloration au bleu de Coomassie, de I’expression in vivo des polypeptides S L et S c a partir des vecteurs d’ex¬ 
pression pIVEX. La souche d’E. co//'BL21 (DE3)pDI A17 transformee par les vecteurs pIVEX recombinants est cultivee 
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a 30°C dans du milieu LB, en presence ou en I'absence d’inducteur (IPTG ImM). Piste 1 : plV2.3S c Piste 2 : 
plV2.3S L . Piste 3 : plV2.4S., Piste 4 : plV2.4S L . 

la figure 4 illustre I’activite antigenique des proteines N, S L et S c recombinantes produites dans la souche E. coti 
BL21(DE3)pDIA17 transformee par les vecteurs pIVEX recombinants. A : electrophorese (SDS-PAGE) des lysats 
bacteriens. B et C : Western-blot avec les serums, provenant d’un meme patient infecte par le SARS-CoV, preleves 
respectivement 8 jours (B : serum Ml2) et 29 jours-(C : serum Ml 3) apres le debut des symptomes du SRAS. Piste 
1 : plV2.3N. Piste 2 : plV2.4N. Piste 3 : plV2.3S c . Piste 4 : plV2.4 S.,. Piste 5 : plV2.3S L . Piste 6 : plV2.4S L 
la figure 5 illustre la purification sur colonne Ni-NTA agarose de la proteine N recombinante produite dans la souche 
E. co//'BL21(DE3)pDIA17 a partir du vecteur plV2.3N. Piste 1 : Extrait bacterien total. Piste 2 : Extrait soluble. Piste 
3 : Extrait insoluble. Piste 4 : Extrait depose sur la colonne Ni-NTA. Piste 5 : proteines non-retenues. Piste 6 : 
Fractions du pic 1. Piste 7 : Fractions du pic 2. 

la figure 6 illustre la purification de la proteine S c recombinante a partir des corps d’inclusions produits dans la 
souche E. co//'BL21(DE3)pDIA17 transformee par le plV2.4S 1 .A. Traitement au Triton X-100 (2%) : Piste 1 : Extrait 
bacterien total. Piste 2 : Extrait soluble. Piste 3 : Extrait insoluble. Piste 4 : Surnageant apres traitement au Triton 
X-100 (2 %). Pistes 5 et 6 : Culot apres traitement au Triton X-100 (2 %).B : Traitement a I’uree 4M, 5M, 6M et 7M 
des extraits solubles et insolubles. 

la figure 7 represente I’immunoempreinte realisee a I’aide d’un lysat de cellules infectees par le SARS-CoV et d'un 
serum de patient atteint de pneumopathie atypique. 

la figure 8 represente des immunoempreintes realisees a I’aide d’un lysat de cellules infectees par le SARS-CoV 
et d’immunserums de lapins specifiques de la nucleoproteine N (A) et de la proteine de spicule S (B). I.S. : serum 
immun. p.i.: serum pre-immun. L’immunserum anti-N a ete utilise au 1/50000 et I'immunserum anti-S au 1/10000. 
la figure 9 illustre la reactivite en ELISA des serums polyclonaux monospecifiques de lapin diriges contre la proteine 
N ou le fragment court de la proteine S (S c ), vis-a-vis des proteines recombinantes correspondantes utilisees pour 
I’immunisation. A : lapins PI3097, PI 3081, et PI 3031 immunises avec la proteine N recombinante purifie. B : lapins 
Pill35, P13042, et P14001 immunises avec une preparation de corps d’inclusions correspondants au fragment 
court de la proteine S (S c ). I.S. : serum immun. p.i. : serum pre-immun. 

la figure 10 illustre la reactivite en ELISA de la proteine N recombinante purifiee, vis-a-vis de serum de patients 
atteints de pneumonie atypique causee par le SARS-CoV. Figure 10a : plaques ELISA prepares avec la proteine 
N a la concentration de 4 |jt,g/ml et 2 pg/ml. Figure 10b : plaque ELISA preparee avec la proteine N a la concentration 
de 1 (j,g/ml. Les serums designes A, B, D, E, F, G, FI correspondent a ceux du Tableau IV. 
la figure 11 illustre I’amplification par RT-PCR de quantites decroissantes d’ARN synthetique du gene N du SARS- 
CoV (10 7 a 1 copie), a I’aide des couples d’amorces n° 1 (N/+/28507,N/-/28774) (A) et n° 2 (N/+/28375,N/-/28702) 
(B). T : amplification realisee en I'absence d’ARN. MW : marqueur d’ADN. 

la figure 12 illustre I’amplification par RT-PCR en temps reel d’ARN synthetique du gene N du SARS-CoV : des 
quantites decroissantes d'ARN synthetique en repliquat (repli. ; pistes 16 a 29) ainsi que de I’ARN viral dilue au 
1/20x10 -4 (piste 32) ont ete amplifies par RT-PCR en temps reel a I’aide du kit "Light Cycler RNA Amplification Kit 
Hybridization Probes" et des couples d’amorces et de sondes de la serie n° 2, dans les conditions decrites a I’exemple 
8 . 

la figure 13.1 a 13.70 (figure 13.1 a 13.70) represente la carte de restriction de la sequence SEQ ID NO : 1 corres- 
pondant a I’equivalent ADN du genome de la souche de SARS-CoV issue du prelevement repertorie sous le numero 
031589. 

la figure 14 montre le resultat du test de serologie SRAS par ELISA N indirect (lere serie de serums testes) 
la figure 15 montre le resultat du test de serologie SRAS par ELISA N indirect (2eme serie de serums testes) 
la figure 16 presente le resultat du test de serologie SRAS par ELISA N double epitope (1 ere serie de serums testes) 
la figure 17 montre le resultat du test de serologie SRAS par ELISA N double epitope (2eme serie de serums testes) 
la figure 18 illustre le test de reactivite des anticorps monoclonaux anti-N par ELISA sur la nucleoproteine N native 
du SRAS-CoV. Les anticorps ont ete testes sous la forme de surnageants de culture d'hybridomes par un ELISA 
indirect utilisant un lysat irradie de cellules VeroE6 infectees par le SRAS-CoV comme antigene (courbes lysat 
SRAS). Un controle negatif de reactivite est realise pour chaque anticorps sur un lysat de cellules VeroE6 non 
infectees (courbes lysat negatif). Plusieurs anticorps monoclonaux de specificite connue ont ete utilises comme 
anticorps temoins negatifs : paral-3 dirige contre les antigenes des virus parainfluenza de type 1-3 (Bio-Rad) et 
grippe B dirige contre les antigenes du virus de la grippe de type B (Bio-Rad). 

la figure 19 illustre le test de reactivite des anticorps monoclonaux anti-N du SRAS-CoV par ELISA sur les antigenes 
natifs du coronavirus humain 229E (HCoV-229E). Les anticorps ont ete testes sous la forme de surnageants de 
culture d’hybridomes par un test ELISA indirect utilisant un lysat de cellules MRC-5 infectees par le coronavirus 
humain 229E comme antigene (courbes lysat 229E). Un controle negatif d’immunoreactivite est realise pour chaque 
anticorps sur un lysat de cellules MRC-5 non infectees (courbes lysat negatif). L’anticorps monoclonal 5-11H.6 
dirige contre la proteine S du coronavirus humain 229E (Sizun et al. 1998, J. Virol. Met. 72 : 145-152) est utilise 
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comme anticorps temoin positif. Les anticorps paral-3 dirige contre les antigenes des virus parainfluenza de type 
1-3 (Bio-Rad) et grippe B dirige contre les antigenes du virus de la grippe de type B (Bio-Rad) ont ete ajoutes au 
panel des anticorps monoclonaux testes. 

la figure 20 montre un test de reactivite des anticorps monoclonaux anti-N du SRAS-CoV par western blot sur la 
nucleoproteine N native du SRAS-CoV denaturee. Un lysat de cellules VeroE6 infectees par le SRAS-CoV a ete 
prepare dans le tampon de depot selon Laemmli et mis a migrer dans un gel SDS a 12% de polyacrylamide puis 
les proteines ont ete transferees sur membrane de PVDF. Les anticorps monoclonaux anti-N testes ont ete utilises 
pour I’immunoessai a la concentration de 0.05 |j,g/ml. La revelation est faite avec des anticorps anti-lgG(H+L) de 
souris couples a la peroxydase (NA93IV, Amersham) et le systeme ECL+. Deux anticorps monoclonaux ont ete 
utilises comme temoins negatifs de reactivite : grippe B dirige contre les antigenes du virus de la grippe de type B 
(Bio-Rad) et paral-3 dirige contre les antigenes des virus parainfluenza de type 1-3 (Bio-Rad), 
la figure 21 presente les plasmides d’expression en cellules de mammiferes de la proteine S du SRAS-CoV. Le 
cDNA de la S du SRAS-CoV a ete insere entre les sites BamHI et Xhol du plasmide d’expression pcDNA3.1(+) 
(Clontech) pour obtenir le plasmide pcDNA-S et entre les sites Nhel et Xhol du plasmide d’expression pCI (Promega) 
pour obtenir le plasmide pCI-S. Les sequences WPRE et CTE ont ete inserees dans chacun des deux plasmides 
pcDNA-S et pCI-S entre les sites Xhol et Xbal pour obtenir respectivement les plasmides pcDNA-S-CTE, pcDNA- 
S-WPRE, pCI-S-CTE et pCI-S-WPRE. 

SP : peptide signal predit(aa 1-13) avec lelogicielsignalPv2.0 (Nielsen etal., 1997, Protein Engineering, 10 :1-6) 
TM : region transmembranaire predite (aa 1196-1218) avec le logiciel TMHMM v2.0 (Sonnhammer et al., 1998, 
Proc. of Sixth Int. Conf. on Intelligent Systems for Molecular Biology, p 175-182, AAAI Press). II faut noter que 
les acides amines W1194 et P1195 font possiblement partie de la region transmembranaire avec des probabilites 
respectives de 0,13 et 0,42 

P-CMV : promoteur immediat/precoce du cytomegalovirus. BGH pA : signal de polyadenylation du gene de 
I’hormone de croissance bovine 

SV40 late pA : signal de polyadenylation tardif du virus SV40 
SD/SA : sites donneur et accepteur d’epissage 

WPRE : sequences du "Woodchuck Hepatitis Virus posttranscriptional regulatory element" du virus de I’hepatite 
de la marmotte 

CTE : sequences du "constitutive transport element" du retrovirus simien de Mason-Pfizer 

la figure 22 illustre I’expression de la proteine S apres transfection de cellules VeroE6. Des extraits cellulaires ont 
ete prepares 48 heures apres transfection de cellulesVeroE6 par les plasmides pcDNA, pcDNA-S, pCI et pCI-S. 
Des extraits cellulaires ont egalement ete prepares 18 heures apres infection par le virus recombinant de la vaccine 
VV-TF7.3 et transfection par les plasmides pcDNA ou pcDNA-S. A titre de controle, des extraits de cellules VeroE6 
ont ete prepares 8 heures apres infection par le SRAS-CoV a une multiplicite d’infection de 3. Ils ont ete separes 
sur un gel SDS a 8% d’acrylamide et analyses par western blot a I’aide d’un anticorps polyclonal de lapin anti-S et 
d’un anticorps polyclonal anti-lgG(H+L) de lapin couple a la peroxidase (NA934V, Amersham). Une echelle de 
masse moleculaire (kDa) est portee sur la figure. 

SRAS-CoV : extrait de cellules VeroE6 infectees par le SRAS-CoV 
Mock : extrait controle de cellules non infectees 

la figure 23 illustre I’effet des sequences CTE et WPRE sur I’expression de la proteine S apres transfection de 
cellules VeroE6 et 293T. Des extraits cellulaires ont ete prepares 48 heures apres transfection de cellulesVeroE6 
(A) ou 293T (B) par les plasmides pcDNA, pcDNA-S, pcDNA-S-CTE, pcDNA-S-WPRE, pCI-S, pCI-S-CTE et pCI- 
S-WPRE, separes sur un gel SDS a 8% d’acrylamide et analyses par western blot a I’aide d’un anticorps polyclonal 
de lapin anti-S et d’un anticorps polyclonal anti-lgG(H+L) de lapin couple a la peroxidase (NA934V, Amersham). 
Une echelle de masse moleculaire (kDa) est portee sur la figure. 

SRAS-CoV : extrait de cellules VeroE6 prepares 8 heures apres infection par le SRAS-CoV a une multiplicite 
d'infection de 3. 

Mock : extrait controle de cellules VeroE6 non infectees 

la figure 24 presente des vecteurs lentiviraux defectifs a DNA flap central pour I’expression de la S du SRAS-CoV. 
Le cADN de la proteine S du SRAS-CoV a ete clone sous la forme d’un fragment BamHI-Xhol dans le plasmide 
pTRIPAU3-CMV contenant un vecteur lentiviral defectif TRIP a DNA flap central (Sirven et al, 2001, Mol. Ther., 3 : 
438-448) pour obtenir le plasmide pTRIP-S. Les cassettes d’expression optimales constitutes du promoteur imme- 
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diat/precoce du virus CMV, d’un signal d’epissage, du cDNA de la S et de I’un ou I’autre des signaux post-transcrip- 
tionnels CTE ou WPRE ont ete substitutes a la cassette EF1 a-EGFP du vecteur d'expression lentiviral defectif a 
DNA FLAP central TRIPAU3-EF1 a (Sirven et al, 2001, Mol. Ther., 3 :438-448) pour obtenir les plasmides pTRIP- 
SD/SA-S-CTE et pTRIP-SD/SA-S-WPRE. 

SP : peptide signal 

TM : region transmembranaire 

P-CMV : promoteur immediat/precoce du cytomegalovirus 

P-EFIoc: promoteur du gene EFIa 

SD/SA : sites donneur et accepteur d’epissage 

WPRE : sequences du "Woodchuck Hepatitis Virus posttranscriptional regulatory element" du virus de I’hepatite 
de la marmotte 

CTE : sequences du "constitutive transport element" du retrovirus simien de Mason-Pfizer 
LTR : « Long terminal repeat » 

AU3 : LTR delete des sequences « promoter/enhancer» 
cPPT : « polypurine tract cis-active sequence » 

CTS : « central termination sequence » 

la figure 25 montre I’analyse par western blot de I’expression de la S du SRAS-CoV par des lignees cellulaires 
transduites par les vecteurs lentiviraux TRIP-SD/SA-S-WPRE et TRIP-SD/SA-S-CTE. Des extraits cellulaires ont 
ete prepares a partir de lignees FrhK4-S-CTE et FrhK4-S-WPRE etablies apres transduction par les vecteurs 
lentiviraux TRIP-SD/SA-S-CTE et TRIP-SD /SA-S-WPRE respectivement. Ms ont ete separes sur un gel SDS a 8% 
d’acrylamide et analyses par western blot a I’aide d’un anticorps polyclonal de lapin anti-S et d’un conjugue anti- 
lgG(H+L) de lapin couple a la peroxidase. Une echelle de masse moleculaire (kDa) est portee sur la figure. 

T-: extrait controle de cellules FrhK-4 

T+ : extrait de cellules FrhK-4 preparees24h apres infection par le SRAS-CoV a une multiplicite d’infection de 3. 

la figure 26 concerne I’analyse de I’expression de polypeptide Ssol par des lignees cellulaires transduites par les 
vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol-CTE. La secretion du polypeptide Ssol a ete 
recherchee dans le surnageant d’une serie de clones cellulaires isoles apres transduction de cellules FRhK-4 par 
les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol-CTE. 5 |jlI de surnageant dilues au 1/2 dans 
du tampon de depot selon Laemmli ont ete analyses par western blot revele par un anticorps monoclonal anti-FLAG 
(M2, Sigma) et un conjugue anti-lgG(H+L) de souris couple a la peroxidase. T-: surnageant de la lignee FRhK-4 
parentale. T + : surnageant de cellules BHK infectees par un virus recombinant de la vaccine exprimant le polypeptide 
Ssol. La fleche pleine indique le polypeptide Ssol, tandis que la fleche creuse indique une reaction croisee avec 
une proteine d’origine cellulaire. 

la figure 27 montre les resultats relatifs a I’analyse du polypeptide Ssol purifie 

A. 8, 2, 0.5 et 0.125 p,g de polypeptide recombinant Ssol purifie par chromatographie d’affinite anti-FLAG et 
gel filtration (G75) ont ete separes sur gel SDS a 8% de polyacrylamide. Le polypeptide Ssol ainsi que des 
quantites variables de marqueurs de masse moleculaire (MM) ont ete reveles par coloration au nitrate d’argent 
(Gelcode SilverSNAP stain kit II, Pierce). 

B. Marqueurs etalons pour I’analyse par spectrometrie de masse SELDI-TOF 

IgG : IgG bovine de MM 147300 
ConA : conalbumine de MM 77490 

HRP : peroxidase de raifort analysee a titre de controle et de MM 43240 

C. Analyse par spectrometrie de masse (SELDI-TOF) du polypeptide recombinant Ssol. 

Les pics A et B correspondent au polypeptide Ssol simplement et doublement charge. 

D. Sequengage de I’extremite N-terminale du polypeptide recombinant Ssol. 5 cycles de degradation d’Edman 
en phase liquide ont ete realises sur un sequenceur ABI494 (Applied Biosystems). 

la figure 28 illustre I’influence d’un signal d’epissage et des sequences CTE et WPRE sur I’efficacite de I’immunisation 
genique a I’aide d’ADN plasmidique codant la S du SRAS-CoV 
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A. Des groupes de 7 souris BALB/c ont ete immunises a deux reprises a 4 semaines d’intervalle a I’aide de 50 
(jig d’ADN plasmidique de pCI, pcDNA-S, pCI-S, pcDNA-N et pCI-HA. 

B. Des groupes de 6 souris BALB/c ont ete immunises a deux reprises a 4 semaines d’intervalle a I’aide de 2 
(jig, 10(jig ou 50 (jig d’ADN plasmidique de pCI, pCI-S, pCI-S-CTE et pCI-S-WPRE. 

Les serums immuns preleves 3 semaines apres la deuxieme immunisation ont ete analyses par ELISA indirect en 
utilisant un lysat de cellules VeroE6 infectees par le SRAS-CoV comme antigene. Les titres en anticorps anti-SRAS- 
CoV sont calcules comme I’inverse de la dilution produisant une DO specifique de 0,5 apres revelation par un 
anticorps polyclonal anti-IgG de souris couple a la peroxidase (NA931V, Amersham) et du TMB (KPL). 
la figure 29 montre la seroneutralisation de I’infectivite du SRAS-CoV par les anticorps induits chez la souris apres 
immunisation genique a I’aide d’ADN plasmidique codant la S du SRAS-CoV. Des pools de serums immuns preleves 
3 semaines apres la deuxieme immunisation ont ete realises pour chacun des groupes des experiences decrites 
dans la figure 28 et evalues pour leur capacite a seroneutraliser I’infectivite de 100 TCID50 du SRAS-CoV sur 
cellules FRhK-4. 4 points sont realises pour chacune des dilutions de raison 2 testees a partir du 1/20. Le titre 
seroneutralisant est calcule selon la methode de Reed et Munsch comme I’inverse de la dilution neutralisant I’in¬ 
fectivite de 2 cupules sur 4. 

A. Groupes de souris BALB/c immunises a deux reprises a 4 semaines d’intervalle a I'aide de 50 (jig d’ADN 
plasmidique de pCI, pcDNA-S, pCI-S, pcDNA-N et pCI-HA. □ : serum preimmun. ■ : serum immun. 

B. Groupes de souris BALB/c immunises a deux reprises a 4 semaines d’intervalle a I'aide de 2 |xg, 10(jig ou 
50 (jig d'ADN plasmidique de pCI, pCI-S, pCI-S-CTE et pCI-S-WPRE. 

la figure 30 illustre I'immunoreactivite du polypeptide recombinant Ssol vis a vis de serums de patients atteints de 
SRAS. La reactivite de serums de patients a ete analysee partest ELISA indirect contre des phases solides preparees 
a I’aide du polypeptide recombinant Ssol purifie. Les anticorps de patients reagissant avec la phase solide a une 
dilution de 1/400 sont reveles par un anticorps polyclonal anti-lgG(H+L) humain couple a la peroxidase (Amersham 
NA933V) et du TMB plus H202 (KPL). Les serums de cas probables de SRAS sont identifies par un numero d’ordre 
du Centre National de Reference des Virus Influenzae ainsi que par les initiales du patient et le nombre de jours 
ecoules depuis le debut des symptomes, le cas echeant. Les serums TV sont des serums temoins de sujets qui 
ont ete preleves en France avant I'epidemie de SRAS survenue en 2003. 

La figure 31 montre I’induction d’anticorps diriges contre le SRAS-CoV apres immunisation avec le polypeptide 
recombinant Ssol. Deux groupe de 6 souris ont ete immunises a 3 semaines d’intervalle avec 10 pig de polypeptide 
recombinant Ssol (groupe Ssol) adjuve avec de I’hydroxyde d’aluminium ou, a titre de controle, de I’adjuvant seul 
(groupe mock).Trois immunisations successives ont ete realisees et les serums immuns ont ete preleves 3 semaines 
apres chacune des trois immunisations (IS1, IS2, IS3). Les serums immuns ont ete analyses par pool pour chacun 
des 2 groupes par ELISA indirect en utilisant un lysat de cellules VeroE6 infectees par le SRAS-CoV comme 
antigene. Les titres en anticorps anti-SRAS-CoV sont calcules comme I’inverse de la dilution produisant une DO 
specifique de 0,5 apres revelation par un anticorps polyclonal anti-IgG de souris couple a la peroxidase (Amersham) 
et du TMB (KPL). 

La figure 32 presente I’alignement nucleotidique des sequences du gene synthetique 040530 avec la sequence du 
gene sauvage de I’isolat 031589 du SRAS-CoV. 1-3059 correspond aux nucleotides 21406-25348 de I’isolat 031589 
du SRAS-CoV depose a la C.N.C.M. sous le numero 1-3059 (SEQ ID NO : 4, plasmide pSRAS-S). S-040530 est la 
sequence du gene synthetique 040530. 

la figure 33 illustre I’utilisation d’un gene synthetique pour I’expression de la S du SRAS-CoV. Des extraits cellulaires 
prepares 48 heures apres transfection de cellulesVeroE6 (A) ou 293T (B) par les plasmides pCI, pCI-S, pCI-S-CTE, 
pCI-S-WPRE et pCI-Ssynth ont ete separes sur un gel SDS a 8% d'acrylamide et analyses par western blot a I’aide 
d’un anticorps polyclonal de lapin anti-S et d’un anticorps polyclonal anti-lgG(H+L) de lapin couple a la peroxidase 
(NA934V, Amersham). Le western blot est revele par luminescence (ECL+, Amersham) et acquisition sur un dispositif 
d’imagerie numerique (FluorS, BioRad). Les niveaux d’expression de la proteine S ont ete mesures en quantifiant 
les 2 bandes majoritaires reperees sur I’image. 

la figure 34 presente un schema de la construction des virus vaccine recombinants VV-TG-S, VV-TG-Ssol, VV-TN- 
S et VV-TN-Ssol 

A. Les cDNA de la proteine S et du polypeptide Ssol du SRAS-CoV ont ete insere entre les sites BamHI et 
Smal du plasmide de transfert pTG186 pour obtenir les plasmides pTG-S et pTG-Ssol. 

B. Les sequences du promoteur synthetique 480 ont ensuite ete substitutes a celles du promoteur 7.5 par 
echange du fragment Ndel-Pstl des plasmides pTG186poly, pTG-S et pTG-Ssol pour obtenir les plasmides 
de transfert pTN480, pTN-S et pTN -Ssol. 
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C. Sequence du promoteur synthetique 480 tel que contenu entre les sites Ndel et Pstl des plasmides de 
transfert de la serie pTN. Un site AscI a ete insere pour faciliter les manipulations ulterieures. Les sites de 
restriction ainsi que la sequence du promoteur sont soulignes 

D. Les virus recombinants de la vaccine sont obtenus par double recombinaison homologue in vivo entre la 
cassette TK des plasmides de transfert des series pTG et pTN et le gene TK de la souche Copenhague du 
virus de la vaccine. 

SP : peptide signal predit (aa 1-13) avec le logiciel signalP v2.0 (Nielsen et al., 1997, Protein Engineering, 
10 : 1 - 6 ) 

TM : region transmembranaire predite (aa 1196-1218) avec le logiciel TMHMM v2.0 (Sonnhammer et al., 
1998, Proc. of Sixth Int. Conf. on Intelligent Systems for Molecular Biology, p 175-182, AAAI Press). II faut 
noter que les acides amines W1194 et P1195 font possiblement partie de la region transmembranaire avec 
des probabilites respectives de 0,13 et 0,42. 

TK-L, TK-R : parties gauche et droite du gene de la thymidine kinase du virus de la vaccine 
MCS : site multiple de clonage 
PE : promoteur precoce 
PL : promoteur tardif 

PL synth : promoteur tardif synthetique 480 

la figure 35 illustre I'expression de la proteine S par les virus vaccine recombinants, analysee par western blot. Des 
extraits cellulaires ont ete prepares 18 heures apres infection de cellules CV1 par les virus vaccine recombinants 
VV-TG, VV-TG-S et VV-TN-S a une M.O.I. de 2 (A). A titre de controle, des extraits de cellules VeroE6 ont ete 
prepares 8 heures apres infection par le SRAS-CoV a une multiplicity d'infection de 2. Des extraits cellulaires ont 
egalement ete prepares 18 heures apres infection de cellules CV1 par les virus vaccine recombinants VV-TG-S, 
VV-TG-Ssol, VV-TN, VV-TN-S et VV-TN-Ssol (B). Ms ont ete separes sur des gels SDS a 8% d'acrylamide et 
analyses par western blot a I'aide d’un anticorps polyclonal de lapin anti-S et d’un anticorps polyclonal anti-lgG(H+L) 
de lapin couple a la peroxidase (NA934V, Amersham). « 1 pi » et« 10pl » indique les quantites d'extraits cellulaires 
deposees sur le gel. Une echelle de masse moleculaire (kDa) est portee sur la figure. 

SRAS-CoV : extrait de cellules VeroE6 infectees par le SRAS-CoV 
Mock : extrait controle de cellules non infectees 

la figure 36 montre le resultat d’une analyse par western blot de la secretion du polypeptide Ssol par les virus vaccine 
recombinants. 

A. Des surnageants de cellules CV1 infectees par le virus vaccine recombinant VV-TN, differents clones du 
virus VV-TN-Ssol et par les virus VV-TG-Ssol ou VV-TN-Sflag ont ete recoltes 18 heures apres infection de 
cellules CV1 a une M.O.I. de 2. 

B. Des surnageants de cellules 293T, FRhK-4, BHK-21 et CV1 infectees en dupliques (1,2) par le virus vaccine 
recombinant VV-TN-Ssol a une M .0.1. de 2 ont ete recoltes 18 heures apres infection. Lesurnageantde cellules 
CV1 infectees par le virus VV-TN a egalement ete recolte a titre de controle (M). 

Tous les surnageants ont ete separes sur un gel SDS a 8% d’acrylamide selon Laemmli et analyses par western 
blot a I’aide d’un anticorps monoclonal de souris anti-FLAG et d’un anticorps polyclonal anti-lgG(H+L) de souris 
couple a la peroxidase (NA931V, Amersham) (A) ou a I’aide d’un anticorps polyclonal de lapin anti-S et d’un anticorps 
polyclonal anti-lgG(H+L) de lapin couple a la peroxidase (NA934V, Amersham) (B). 

Une echelle de masse moleculaire (kDa) est portee sur la figure. 

la figure 37 montre I’analyse du polypeptide Ssol, purifie par gel SDS de polyacrylamide 

10, 5 et 2 jjlI de polypeptide recombinant Ssol purifie par chromatographie d'affinite anti-FLAG ont ete separes sur 
gel SDS en gradient de 4 a 15 % de polyacrylamide. Le polypeptide Ssol ainsi que des quantites variables de 
marqueurs de masse moleculaire (MM) ont ete reveles par coloration au nitrate d'argent (Gelcode SilverSNAP stain 
kit II, Pierce). 

la figure 38 illustre I’immunoreactivite du polypeptide recombinant Ssol produit par le virus vaccine recombinant VV- 
TN-Ssol vis-a-vis de serums de patients atteints de SRAS. La reactivity de serums de patients a ete analysee par 
test ELISA indirect contre des phases solides preparees a I’aide du polypeptide recombinant Ssol purifie. Les 
anticorps de patients reagissant avec la phase solide a une dilution de 1/100 et 1/400 sont reveles par un anticorps 
polyclonal anti-lgG(H+L) humain couple a la peroxidase (Amersham NA933V) et du TMB plus H202 (KPL). Les 
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serums de cas probables de SRAS sont identifies par un numero d’ordre du Centre National de Reference des 
Virus Influenzae ainsi que par les initiales du patient et le nombre de jours ecoules depuis le debut des symptomes, 
le cas echeant. Les serums TV sont des serums temoins de sujets qui ont ete preleves en France avant I’epidemie 
de SRAS survenue en 2003. 

la figure 39 montre la reponse en anticorps anti-SRAS-CoV chez la souris apres immunisation par les virus vaccine 
recombinants. Des groupes de 7 souris BALB/c ont ete immunises par voie i.v. a deux reprises a 4 semaines 
d’intervalle par 106 u.f.p. de virus vaccine recombinants VV-TG, VV-TG-HA, VV-TG-S, VV-TG-Ssol, VV-TN, VV- 
TN-S, VV-TN-Ssol. 

A. Des pools de serums immuns preleves 3 semaines apres chacune des deux immunisations ont ete realises 
pour chacun des groupes et ont ete analyses par ELISA indirect en utilisant un lysat de cellules VeroE6 infectees 
par le SRAS-CoV comme antigene. Les titres en anticorps anti-SRAS-CoV sont calcules comme I’inverse de 
la dilution produisant une DO specifique de 0,5 apres revelation par un anticorps polyclonal anti-IgG de souris 
couple a la peroxidase (NA931V, Amersham) et du TMB (KPL). 

B. Les pools de serums immuns ont ete evalues pour leur capacite a seroneutraliser I’infectivite de 100 TCID50 
du SRAS-CoV sur cellules FRhK-4. 4 points sont realises pour chacune des dilutions de raison 2 testees a 
partir du 1/20. Le titre seroneutralisant est calcule selon la methode de Reed et Munsch comme I'inverse de la 
dilution neutralisant I’infectivite de 2 cupules sur 4. 

la figure 40 decrit la construction des virus recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol. 

A. Le vecteur rougeole est un genome complet de la souche vaccinale Schwarz du virus de la rougeole (MV) 
dans lequel une unite de transcription supplementaire a ete introduite (Combredet, 2003, Journal of Virology, 
77 : 11546-11554). L’expression des phases ouvertes de lecture (ORF) supplementaires est controlee par les 
elements agissant en cis necessaires a la transcription, a la formation de la coiffe et a la polyadenylation du 
transgene, qui ont ete copies des elements presents a la jonction N/P. 2 vecteurs differents permettent I’insertion 
entre les genes P (phosphoproteine) et M (matrice) d’une part et H (hemagglutinine) et L (polymerase) d’autre 
part. 

B. Les genomes recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol du virus de la rougeole ont ete 
construits par I’insertion des ORFs de la proteine S et du polypeptide Ssol au sein d’une unite de transcription 
supplementaire localisee entre les genes P et M du vecteur. 

Les differents genes du virus de la rougeole (MV) sont indiques : N (nucleoproteine), PVC (phosphoproteine 
et proteine V/C), M (matrice), F (fusion), H (hemagglutinine), L (polymerase). T7 = promoteur de I'ARN 
polymerase T7, hh = ribozyme hammerhead, T7t = sequence terminatrice de I'ARN polymerase du phage 
T7, d = ribozyme du virus de I’hepatite 9, (2), (3) = unites de transcription supplementaires (ATU). 

Taille du genome du MV : 15894 nt. 

SP : peptide signal 

TM : region transmembranaire 

FLAG : etiquette FLAG 

la figure 41 illustre I'expression de la proteine S par les virus rougeole recombinants, analysee par western blot. 

Des extraits cytoplasmiques ont ete prepares apres infection de cellules Vero par differents passages des virus 
MVSchw2-SARS-S et MVSchw2-SARS-Ssol et le virus sauvage MWSchw a titre de controle. Des extraits 
cellulaires en tampon de depot selon Laemmli ont egalement ete prepares 8 heures apres infection de cellules 
VeroE6 par le SRAS-CoV a une multiplicity d’infection de 3. Ms ont ete separes sur un gel SDS a 8% d’acrylamide 
et analyses par western blot a I'aide d’un anticorps polyclonal de lapin anti-S et d’un anticorps polyclonal anti- 
lgG(H+L) de lapin couple a la peroxidase (NA934V, Amersham). 

Une echelle de masse moleculaire (kDa) est portee sur la figure. 

Pn : nieme passage du virus apres coculture de cellules 293-3-46 et Vero. 

SRAS-CoV : extrait de cellules VeroE6 infectees par le SRAS-CoV 
Mock : extrait controle de cellules VeroE6 non infectees 

la figure 42 montre I’expression de la proteine S par les virus rougeole recombinants, analysee par immunofluores¬ 
cence 

Des cellules Vero en monocouches sur lamelles de verre ont ete infectees par le virus sauvage MWSchw (A) ou 
les virus MVSchw2-SARS-S (B) et MVSchw2-SARS-Ssol (C). Quand les syncytia ont atteint 30 a 40% de confluence 
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(A., B.) ou 90-100% (C), les cellules ont ete fixees, permeabilisees et marquees par des anticorps polyclonaux de 
lapins anti-SRAS-CoV et un conjugue anti-lgG(H+L) de lapin couple au FITC (Jackson). 

la figure 43 illustre I'analyse par western blot de I’immunoreactivite de serums de lapins diriges contre les peptides 
El-12, E53-76 et M2-14. Le lapin 20047 a ete immunise avec le peptide El-12 couple a la KLH. Les lapins 22234 
et 22240 ont ete immunises avec le peptide E53-76 couple a la KLH. Les lapins 20013 et 20080 ont ete immunises 
avec le peptide M2-14 couple a la KLH. Les immunserums ont ete analyses par western blot a I'aide d’extraits de 
cellules infectees par le SRAS-CoV (B) ou a I’aide d'extraits de cellules infectees par un virus recombinant de la 
vaccine exprimant la proteine E (A) ou M (C) de I’isolat 031589 du SRAS-CoV. Les immunoempreintes ont ete 
revelees a I’aide d’un conjugue anti-lgG(H+L) de lapin couple a la peroxidase (NA934V, Amersham). 

[0148] La position des proteines E etM est indiquee par une fleche. 

[0149] Une echelle de masse moleculaire (kDa) est portee sur la figure. 

[0150] II doit etre bien entendu, toutefois, que ces exemples sont donnes uniquement a titre d’illustration de I’objet de 
I’invention, dont ils ne constituent en aucune maniere une limitation. 

Exemple 1 : Clonage et sequengage du genome de la souche de SARS-CoV issue du prelevement repertorie 
sous le numero 031589 

[0151] L’ARN de la souche de SARS-CoV a ete extrait a partir du prelevement de lavage bronchoalveolaire repertorie 
sous le numero 031589, effectue sur un patient de I'hopital frangais de Hanoi (Vietnam) atteint de SRAS. 

[0152] L’ARN isole a ete utilise comme matrice pour amplifier les ADNc correspondant aux differents cadres ouverts 
de lecture du genome (ORF la, ORF1 b, ORF-S, ORF-E, ORF-M, ORF-N (incluant les ORF-13 et ORF-14), ORF3, ORF4, 
ORF7 a ORF11), et aux extremites 5’ et 3’ non-codantes. Les sequences des amorces et des sondes utilisees pour 
I'amplification/detection ont ete definies d’apres la sequence nucleotidique disponible du SARS-CoV. 

[0153] Dans ce qui suit les amorces et les sondes sont identifies par: la lettre S, suivie d’une lettre qui indique la 
region correspondante du genome (L pour I’extremite 5’incluant ORFIa et ORFIb ; S, M et N pour les ORF-S, ORF-M, 
ORF-N, SE et MN pour les regions intergeniques correspondantes), puis eventuellement de Fn, Rn, avec n inclus entre 
1 et 6 correspondant aux amorces utilisees pour la PCR nichee ou imbriquee (paire FI + R1 pour la premiere amplification, 
paire F2 + R2 pour la deuxieme amplification, etc...), puis de /+/ ou /-/ correspondant a une amorce sens ou antisens 
et enfin des positions des amorces en reference a la sequence Genbank AY27411.3 ; pour les amorces S et N sens et 
antisens et les autres amorces sens uniquement, lorsqu’une seule position est indiquee elle correspond a celle de 
I'extremite 5’ d’une sonde ou d’une amorce d’environ 20 bases ; pour les amorces antisens autres que les amorces S 
et N, lorsqu’une seule position est indiquee elle correspond a celle de I'extremite 3’ d’une sonde ou d’une amorce 
d’environ 20 bases. 

[0154] Les produits d’amplifications ainsi generes ont ete sequences a I'aide d’amorces specifiques afin de determiner 
la sequence complete du genome de la souche de SARS-CoV issue du prelevement repertorie sous le numero 031589. 
Ces produits d’amplification, a I’exception de ceux correspondant aux ORFIa et ORFIb, ont ensuite ete clones dans 
des vecteurs d’expression afin de produire les proteines virales correspondantes et les anticorps diriges contre ces 
proteines, notamment par immunisation a base d’ADN. 

1. Extraction des ARN 

[0155] Les ARN ont ete extraits a I’aide du kit Qlamp viral RNA extraction mini (QIAGEN) en suivant les recomman- 
dations du fabricant. De maniere plus precise : 140 pul du prelevement et 560 |xl de tampon AVL ont ete melanges 
vigoureusement pendant 15 secondes, incubes 10 min a temperature ambiante puis centrifuges brievement a vitesse 
maximale. 560 |xl d’ethanol a 100% ont ete ajoutes au surnageant et le melange ainsi obtenu a ete agite tres vigoureu¬ 
sement pendant 15 sec. 630 |xl du melange ont ensuite ete deposes sur la colonne. 

[0156] La colonne a ete placee sur un tube de 2 ml, centrifugee 1 min a 8000 rpm, puis le reste du melange precedent 
a ete depose sur la meme colonne, centrifuge a nouveau, 1 min a 8000 rpm et la colonne a ete transferee sur un tube 
de 2 ml propre. Ensuite, 500 |xl de tampon AW1 ont ete ajoutes sur la colonne, puis la colonne a ete centrifugee 1 min 
a 8000 rpm et I'eluat a ete elimine. 500 (jlI de tampon AW2 ont ete ajoutes sur la colonne qui a ensuite ete centrifugee 
3 min a 14000 rpm et transferee sur un tube de 1,5 ml. Enfin, 60 |xl de tampon AVE ont ete ajoutes sur la colonne qui 
a ete incubee 1 a 2 min a temperature ambiante puis centrifugee 1 min a 8000 rpm. L'eluat correspondant a I’ARN purifie 
a ete recupere et congele a -20°C. 
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2. Amplification, sequengage et clonage des ADNc 

2.1) ADNc codant pour la proteine S 

[0157] Les ARN extraits a partir du prelevement ont ete soumis a une transcription inverse a I’aide d’oligonucleotides 
hexameriques de sequence aleatoire (pdN6), afin de produire des fragments d’ADNc. 

[0158] La sequence codant pour la glycoproteine S du SARS-CoV a ete amplifiee sous la forme de deux fragments 
d'ADN chevauchants : fragment 5’ (SRAS-Sa, SEQ ID NO:5) et fragment 3’(SRAS-Sb, SEQ ID NO:6), en realisant deux 
amplifications successives a I’aide d’amorces imbriquees. Les amplicons ainsi obtenus ont ete sequences, clones dans 
le vecteur plasmidique PCR 2.1-TOPO™ (IN VITROGEN), puis la sequence des ADNc clones a ete determinee. 

a) clonage et sequengage des fragments Sa et Sb 

a-,) synthese de I’ADNc 

[0159] Le melange reactionnel contenant: ARN (5 pi), H 2 0 ppi (3,5 pi), tampon de transcriptase inverse5X (4 pi,), 
dNTP 5 mM (2 pi), pdN6 100 ug/ml (4 pi), RNasin 40 Ul/ul (0,5 pi) et transcriptase inverse AMV-RT, 10 Ul/ul, PROMEGA 
(1 pi) a ete incube dans un thermocycleur dans les conditions suivantes : 45 min a 42°C, 15 min a 55°C, 5 min a 95°C, 
puis I’ADNc obtenu a ete maintenu a +4°C. 

a 2 ) premiere amplification PCR 

[0160] Les extremites 5’ et 3’ du gene S ont ete amplifies respectivement avec les paires d'amorces S/FI/+/ 
21350-21372 et S/R1/-/ 23518-23498, S/F3/+/ 23258-23277 et S/R3/-/25382-25363. Le melange reactionnel de 50 pi 
contenant: ADNc (2 pi), amorces 50 pM (0,5 pi), tampon 10 X (5 pi), dNTP 5 mM (2 pi), Taq Expand High Fidelity, 
Roche (0,75 pi) et H 2 0 (39, 75 pi) a ete amplifie dans un thermocycleur, dans les conditions suivantes : une etape initiale 
de denaturation a 94°C pendant 2 min a ete suivie de 40 cycles comprenant: une etape de denaturation a 94°C pendant 
30 sec, une etape d’hybridation a 55°C pendant 30 sec puis une etape d’elongation a 72°C pendant 2 min 30 sec, avec 
10 sec d’elongation supplementaire a chaque cycle, puis d’une etape finale d'elongation a 72°C pendant 5 min. 

a 3 ) deuxieme amplification PCR 

[0161] Les produits de la premiere amplification PCR (amplicons 5’ et 3') ont subi une seconde etape d’amplification 
PCR (PCR nichee) dans des conditions identiques a celles de la premiere amplification, avec les paires d’amorces 
S/F2/+/21406-21426 et S/R2/-/23454-23435, et S/F4/+/23322-23341 et S/R4/-/25348-25329, respectivement pour I’am- 
plicon 5’ et I’amplicon 3’. 

a 4 ) clonage et sequengage des fragments Sa et Sb 

[0162] Les amplicons Sa (extremite 5’) et Sb (extremite 3’) ainsi obtenus ont ete purifies a I’aide du kit QIAquick PCR 
purification (QIAGEN), en suivant les recommandations du fabricant, puis ils ont ete clones dans le vecteur PCR2.1- 
TOPO (kit Invitrogen), pour donner les plasmides denommes SRAS-S1 et SRAS-S2. 

[0163] L’ADN des clones Sa et Sb a ete isole puis I’insert correspondant a ete sequence a I’aide du Kit Big Dye, 
Applied Biosystem® et des amorces universelles Ml3 forward et Ml3 reverse, ainsi que des amorces : S/S/+/21867, 
S/S/+/22353, S/S/+/22811, S/S/+/23754, S/S/+/24207, S/S/+/24699, S/S/+/24348, S/S/-/24209, S/S/-/23630, S/S/-/ 
23038, S/S/-/22454, S/S/-/21815, S/S/-/24784, S/S/+/21556, S/S/+/23130 et S/S/+/24465, en suivant les instructions 
du fabricant; les sequences des fragments Sa et Sb ainsi obtenues correspondent aux sequences SEQ ID NO :5 et 
SEQ ID NO :6 dans la liste de sequences jointe en annexe. 

[0164] Le plasmide, denomme SARS-S1 a ete depose sous le n° 1-3020, le 12 mai 2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un fragment 5’ 
de la sequence du gene S de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle que 
definie ci-dessus, lequel fragment denomme Sa correspondant aux nucleotides des positions 21406 a 23454 (SEQ ID 
NO :5), en reference a la sequence Genbank AY274119.3 Tor2. 

[0165] Le plasmide, denomme TOP10F’-SARS-S2 a ete depose sous le n° 1-3019, le 12 mai 2003, aupres de la 
Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un 
fragment 3’de la sequence du gene S de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589, 
telle que definie ci-dessus, lequel fragment denomme Sb correspondant aux nucleotides des positions 23322 a 25348 
(SEQ ID NO : 6), en reference a la sequence Genbank n° d’acces AY274119.3. 
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b) clonage et sequengage de I’ADNc complet (clone SRAS-S de 4 kb) 

[0166] L’ADNc S complet a ete obtenu a partir des clones SARS-S1 et SARS-S2 precites, de la fagon suivante : 

1) une reaction d'amplification PCR a ete realisee sur un clone SARS-S2 en presence de I’amorce S/R4/-/ 
25348-25329 precitee et de I’amorce S/S/+/24696-24715: un amplicon de 633 pb a ete obtenu, 

2) une autre reaction d’amplification PCR a ete realisee sur un autre clone SARS-S2, en presence des amorces 
S/F4/+/23322-23341 precitee et S/S/- /24803-24784: un amplicon de 1481 pb a ete obtenu, 

La reaction d'amplification a ete realisee dans les conditions telles que definies ci-dessus pour I’amplification des 
fragments Sa et Sb, a I’exception que 30 cycles d’amplifications comprenant une etape de denaturation a 94° C 
pendant 20 sec et une etape d'elongation a 72° C pendant 2 min 30 sec ont ete effectues. 

3) les 2 amplicons (633 pb et 1481 pb) ont ete purifies dans les conditions telles que definies ci-dessus pour les 
fragments Sa et Sb. 

4) une autre reaction d’amplification PCR a I'aide des amorces S/F4/+/23322-23341 et S/R4/-/25348-25329 preci- 
tees, a ete realisee sur les amplicons purifies obtenus en 3). La reaction d’amplification a ete realisee dans les 
conditions telles que definies ci-dessus pour I’amplification des fragments Sa et Sb, a I’exception que 30 cycles 
d’amplifications ont ete effectues. 

L’amplicon de 2026 pb ainsi obtenu a ete purifie, clone dans le vecteur PCR2.1-TOPO puis sequence comme ci- 
dessus, a I’aide des amorces telles que definies ci-dessus pour les fragments Sa et Sb. Le clone ainsi obtenu a ete 
denomme clone 3’. 

5) Le clone SARS-S1 precedemment obtenu et le clone 3’ont ete digeres par EcoR I, les bandes d’environ 2kb ainsi 
obtenues ont ete purifiees sur gel puis amplifies par PCR avec les amorces S/F2/+/21406-21426 et S/R4/-/ 
25348-25329 precitees. La reaction d’amplification a ete realisee dans les conditions telles que definies ci-dessus 
pour I'amplification des fragments Sa et Sb, a I'exception que 30 cycles d’amplifications ont ete effectues. L’amplicon 
d’environ 4 kb a ete purifie et sequence. II a ensuite ete clone dans le vecteur PCR2.1-TOPO pour donner le 
plasmide, denomme SARS-S, et I’insert contenu dans ce plasmide a ete sequence comme ci-dessus, a I’aide des 
amorces telles que definies ci-dessus pour les fragments Sa et Sb. Les sequences d'ADNc de I’insert et de I’amplicon 
codant pour la proteine S, correspondent respectivement aux sequences SEQ ID NO : 4 et SEQ ID NO : 2 dans la 
liste de sequences jointe en annexe, elles codent pour la proteine S (SEQ ID NO : 3). 

[0167] La sequence de I’amplicon correspondant a I’ADNc codant pour la proteine S de la souche de SARS-CoV 
issue du prelevement n°031589 presente les deux mutations suivantes par rapport aux sequences correspondantes de 
respectivement les isolats Tor2 et Urbani, les positions des mutations etant indiquees en reference a la sequence 
complete du genome de I’isolat Tor2 (Genbank AY274119.3): 

g/t en position 23220 ; le codon alanine (get) en position 577 de la sequence en acides amines de la proteine S de 
Tor2 est remplace par un codon serine (tet), 

c/t en position 24872 : cette mutation ne modifie pas la sequence en acides amines de la proteine S, et 

[0168] Le plasmide, denomme SARS-S, a ete depose sous le n° 1-3059, le 20 juin 2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence 
d'ADNc codant pour la proteine S de la souche de SARS-CoV issue du prelevement repertories sous le n° 031589, 
laquelle sequence correspondant aux nucleotides des positions 21406 a 25348 (SEQ ID NO :4), en reference a la 
sequence Genbank AY274119.3. 

2.2) ADNc codant pour les proteines M et E 

[0169] Les ARN issus du prelevement 031589, extraits comme ci-dessus, ont ete soumis a une transcription inverse, 
associee, lors de la meme etape (kit Titan One Step RT-PCR ®, Roche), a une reaction d’amplification par PCR, a I’aide 
des couples d’amorces : 

- S/E/F1/+/26051-26070 et S/E/RI/-/26455-26436 pour amplifier I’ORF-E, et 

- S/M/F1/+/26225-26244 et S/M/RI/-/27148-27129 pour amplifier I’ORF-M. 

[0170] Un premier melange reactionnel contenant: 8,6 |xl d’H 2 Oppi, 1 |xl de dNTP (5mM), 0,2 |xl de chacune des 
amorces (50 |jlM), 1,25 |xl de DTT (lOOmM) et 0,25 |xl de RNAsin (40 UI/|jlI) a ete combine avec un deuxieme melange 
reactionnel contenant: 1 pul d'ARN, 7 pul d’H 2 Oppi, 5 pul de tampon de RT-PCR 5X et 0,5 pd de melange d’enzyme et les 
melanges combines ont ete incubes dans un thermocycleur dans les conditions suivantes : 30 min a 42°C, 10 min a 
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55°C, 2 min a 94°C suivi de 40 cycles comprenant une etape de denaturation a 94°C pendant 10 sec, une etape 
d’hybridation a 55°C pendant 30 sec et une etape d'elongation a 68°C pendant 45 sec, avec 3 sec d’increment par cycle 
et enfin une etape d'elongation terminale a 68°C pendant 7 min. 

[0171] Les produits d’amplification ainsi obtenus (amplicons M et E) ont subi une deuxieme amplification PCR (PCR 
nichee) en utilisant le kit Expand High-Fi®, Roche), a I’aide des couples d’amorces : 

- S/E/F2/+/26082-26101 et S/E/R2/-/26413-26394 pour I’amplicon E, et 

- S/M/F2/+/26330-26350 et S/M/R2/-/27098-27078 pour I’amplicon M. 

[0172] Le melange reactionnel contenant: 2 |xl du produit de la premiere PCR, 39,25 pi d’H 2 Oppi, 5 pi de tampon 
10X contenant du MgCI 2 , 2 pi de dNTP (5mM), 0,5pl de chacune des amorces (50 pM) et 0,75pl de melange d’enzyme 
a ete incube dans un thermocycleur dans les conditions suivantes : une etape de denaturation a 94°C pendant 2 min a 
ete suivie de 30 cycles comprenant une etape de denaturation a 94°C pendant 15 sec, une etape d’hybridation a 60°C 
pendant 30 sec et une etape d’elongation a 72°C pendant 45 sec, avec 3 sec d’increment par cycle, et enfin une etape 
d’elongation terminale a 72°C pendant 7 min. Les produits d’amplification obtenus correspondant aux ADNc codant 
pour les proteines E et M ont ete sequences comme ci-dessus, a I’aide des amorces : S/E/F2/+/26082 et S/E/R2/-/ 
26394, S/M/F2/+/26330, S/M/R2/-/27078 precitees et des amorces S/M/+/26636-26655 et S/M/-/26567-26548. Ils ont 
ensuite ete clones, comme ci-dessus, pour donner les plasmides denommes SARS-E et SARS-M. L’ADN de ces clones 
a ensuite ete isole et sequence a I’aide des amorces universelles M13 forward et M13 reverse ainsi que des amorces 
S/M/+/26636 et S/M/-/26548 precitees. 

[0173] La sequence de I’amplicon representant I'ADNc codant pour la proteine E (SEQ ID NO : 13) de la souche de 
SARS-CoV issue du prelevement n°031589 ne comporte pas de differences par rapport aux sequences correspondantes 
des isolats AY274119.3-Tor2 et AY278741-Urbani. La sequence de la proteine E de la souche de SARS-CoV 031589 
correspond a la sequence SEQ ID NO : 14 dans la liste de sequences jointe en annexe. 

[0174] Le plasmide, denomme SARS-E a ete depose sous le n° 1-3046, le 28 mai 2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence 
d’ADNc codant pour la proteine E de la souche de SARS-CoV issue du prelevement repertories sous le n° 031589, telle 
que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 26082 a 26413 (SEQ ID NO : 
15), en reference a la sequence Genbank n° d’acces AY274119.3. 

[0175] La sequence de I’amplicon representant I’ADNc codant pour la M (SEQ ID NO : 16) de la souche de SARS- 
CoV issue du prelevement n°031589 ne comporte pas de differences par rapport a la sequence correspondante de 
I'isolat AY274119.3-Tor2. En revanche, en position 26857,1’isolat AY278741-Urbani comporte un c et la sequence de 
la souche de SARS-CoV issue du prelevement repertorie sous le n°031589 un t. Cette mutation aboutit a une modification 
de la sequence en acides amines de la proteine correspondante: en position 154, une proline (AY278741-Urbani) est 
changee en serine dans la souche de SARS-CoV issue du prelevement repertorie sous le n°031589. La sequence de 
la proteine M de la souche de SARS-CoV issue du prelevement repertorie sous le n°031589 correspond a la sequence 
SEQ ID NO : 17 dans la liste de sequences jointe en annexe. 

[0176] Le plasmide, denomme SARS-M a ete depose sous le n° 1-3047, le 28 mai 2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence 
d’ADNc codant pour la proteine M de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle 
que definie ci-dessus ; laquelle sequence correspondant aux nucleotides des positions 26330 a 27098 (SEQ ID NO : 
18), en reference a la sequence Genbank n° d’acces AY274119.3. 

2.3) ADNc correspondant aux ORF3, ORF4, ORF7 a ORF11 

[0177] La meme strategie d’amplification, de clonage et de sequengage a ete utilisee pour obtenir les fragments 
d’ADNc correspondant respectivement aux ORF suivantes: ORF 3, ORF4, ORF7, ORF8, ORF9, ORF10 et ORF11. Les 
couples d’amorces utilisees pour la premiere amplification sont: 

- ORF3 et ORF4 : S/SE/F1/+/25069-25088 et S/SE/R1/-/26300-26281 

- ORF7 a ORF11 : S/MN/F1/+/26898-26917 et S/MN/R1/-/28287-28266 

[0178] Les couples d’amorces utilisees pour la deuxieme amplification sont: 

- ORF3 et ORF4 : S/SE/F2/+/25110-25129 et S/SE/R2/-/26244-26225 

- ORF7 a ORF11 : S/MN/F2/+/26977-26996 et S/MN/R2/-/28218-28199 

[0179] Les conditions de la premiere amplification (RT-PCR) sont les suivantes : 45 min a 42°C, 10 min a 55°C, 2 
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min a 94°C suivi de 40 cycles comprenant une etape de denaturation a 94°C pendant 15 sec, une etape d’hybridation 
a 58°C pendant 30 sec et une etape d'elongation a 68°C pendant 1 min, avec 5 sec d’increment par cycle et enfin une 
etape d'elongation terminale a 68°C pendant 7 min. 

Les conditions de la PCR nichee sont les suivantes : une etape de denaturation a 94°C pendant 2 min a ete suivie de 
40 cycles comprenant une etape de denaturation a 94°C pendant 20 sec, une etape d’hybridation a 58°C pendant 30 
sec et une etape d’elongation a 72°C pendant 50 sec, avec 4 sec d’increment par cycle et enfin une etape d’elongation 
terminale a 72°C pendant 7 min. 

[0180] Les produits d'amplification obtenus correspondant aux ADNc contenant respectivement les ORF3 et 4 et les 
ORF7 a 11 ont ete sequences a I’aide des amorces : S/SE/+/25363, S/SE/+/25835, S/SE/-/25494, S/SE/-/25875, S/MN/ 
+/27839, S/MN/+/27409, S/MN/-/27836 S/MN/-/27799 et clones comme ci-dessus pour les autres ORF, pour donner 
les plasmides denommes SARS-SE et SARS-MN. L'ADN de ces clones a ete isole et sequence a I’aide de ces memes 
amorces et des amorces universelles M13 sens et M13 anti-sens. 

[0181] La sequence de I’amplicon representant I’ADNc de la region contenant les ORF 3 et 4 (SEQ ID NO :7) de la 
souche de SARS-CoV issue du prelevement n°031589 comporte une difference nucleotidique par rapport a la sequence 
correspondante de I’isolat AY274119-Tor2. Cette mutation en position 25298 aboutit a une modification de la sequence 
en acides amines de la proteine correspondante (ORF 3): en position 11, une arginine (AY274119-Tor2) est changee 
en glycine dans la souche de SARS-CoV issue du prelevement n°031589. En revanche, aucune mutation n’a ete 
identifiee par rapport a la sequence correspondante de I’isolat AY278741-Urbani. Les sequences des ORF 3 et 4 la 
souche de SARS-CoV issue du prelevement n°031589 correspondent respectivement aux sequences SEQ ID NO : 10 
et 12 dans la liste de sequences jointe en annexe. 

[0182] Le plasmide, denomme SARS-SE a ete depose sous le n° 1-3126, le 13 novembre2003, aupresde la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient I’ADNc corres¬ 
pondant a la region situee entre I’ORF-S et I’ORF-E et chevauchant I’ORF-E de la souche de SARS-CoV issue du 
prelevement repertorie sous le n° 031589, telle que definie ci-dessus, laquelle region correspondant aux nucleotides 
des positions 25110 a 26244 (SEQ ID NO :8), en reference a la sequence Genbank n° d’acces AY274119.3, 

[0183] La sequence de I’amplicon representant I’ADNc correspondant a la region contenant les ORF7 a ORF11 (SEQ 
ID NO :19) de la souche de SARS-CoV issue du prelevement n°031589 ne comporte pas de differences par rapport 
aux sequences correspondantes des isolats AY274119-Tor2 et AY278741-Urbani. Les sequences des ORF7 a 11 de 
la souche de SARS-CoV issue du prelevement n°031589 correspondent respectivement aux sequences SEQ ID NO : 
22, 24, 26, 28 et 30 dans la liste de sequences jointe en annexe. 

[0184] Le plasmide denomme SARS-MN a ete depose sous le n° 1-3125, le 13 novembre 2003, aupresde la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence 
d’ADNc correspondant a la region situee entre I’ORF-M et I’ORF-N de la souche de SARS-CoV issue du prelevement 
repertorie sous le n° 031589 et prelevee a Hanoi, telle que definie ci-dessus, laquelle sequence correspondant aux 
nucleotides des positions 26977 a 28218 (SEQ ID NO :20 ), en reference a la sequence Genbank n° d’acces AY274119.3. 
[0185] La sequence de I’amplicon representant I’ADNc correspondant a la region contenant les ORF7 a ORF11 (SEQ 
ID NO : 19) de la souche de SARS-CoV issue du prelevement n°031589 ne comporte pas de differences par rapport 
aux sequences correspondantes des isolats AY274119-Tor2 et AY278741-Urbani. Les sequences des ORF7 a 11 de 
la souche de SARS-CoV issue du prelevement n°031589 correspondent respectivement aux sequences SEQ ID NO : 
22, 24, 26, 28 et 30 dans la liste de sequences jointe en annexe. 

2.4) ADNc codant pour la proteine N et incluant les ORF13 et ORF14 

[0186] L’ADNc a ete synthetise et amplifie comme decrit ci-dessus pour les fragments Sa et Sb. De maniere plus 
precise, le melange reactionnel contenant: 5 pel d’ARN, 5 p.1 d’H 2 0 ppi 4 pul de tampon de reverse transcriptase 5X, 2 
ptl de dNTP (5 mM), 2 pi d’oligo 20T (5 pM), 0,5 pi de RNasin (40 Ul/ul) et 1,5 pi de AMV-RT (10 Ul/ul Promega) a ete 
incube dans un thermocycleur dans les conditions suivantes : 45 min a 42°C, 15 min a 55°C, 5 min a 95°C, puis il a ete 
maintenu a +4°C. 

[0187] Une premiere amplification PCR a ete realisee avec la paire d’amorces S/N/F3/+/28023 et S/N/R3/-/29480. 
[0188] Le melange reactionnel comme ci-dessus pour I’amplification des fragments SI et S2 a ete incube dans un 
thermocycleur, dans les conditions suivantes : une etape initiale de denaturation a 94°C pendant 2 min a ete suivie de 
40 cycles comprenant une etape de denaturation a 94°C pendant 20 sec, une etape d’hybridation a 55°C pendant 30 
sec puis une etape d’elongation a 72°C pendant 1 min 30 sec avec 10 sec d’elongation supplementaire a chaque cycle, 
puis d’une etape finale d'elongation a 72°C pendant 5 min. 

[0189] L’amplicon obtenu a la premiere amplification PCR a subi une seconde etape d'amplification PCR (PCR nichee) 
avec la paires d’amorce S/N/F4/+/28054 et S/N/R4/-/29430 dans des conditions identiques a celles de la premiere 
amplification. 

[0190] Le produit d’amplification obtenu correspondant a I’ADNc codant pour la proteine N de la souche de SARS- 
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CoV issue du prelevement n°031589a ete sequence a I’aide des amorces: S/N/F4/+/28054, S/N/R4/-/29430, S/N/+/ 
28468, S/N/+/28918 et S/N/-/28607 et clone comme ci-dessus pour les autres ORF, pour donner le plasmide denomme 
SARS-N. LADN de ces clones a ete isole et sequence a I’aide des amorces universelles M13 sens et M13 anti-sens, 
ainsi que des amorces S/N/+/28468, S/N/+/28918 et S/N/-/28607. 

[0191] La sequence de I’amplicon representant I’ADNc correspondant a I’ORF-N et incluant les ORF13 et ORF14 
(SEQ ID NO :36) de la souche de SARS-CoV issue du prelevement n°031589 ne comporte pas de differences par 
rapport aux sequences correspondantes des isolats AY274119.3-Tor2 et AY278741-Urbani. La sequence de la proteine 
N de la souche de SARS-CoV issue du prelevement n°031589 correspond a la sequence SEQ ID NO : 37 dans la liste 
de sequences jointe en annexe. 

[0192] Les sequences des ORF13 et 14 de la souche de SARS-CoV issue du prelevement n°031589 correspondent 
respectivement aux sequences SEQ ID NO : 32 et 34 dans la liste de sequences jointe en annexe. 

[0193] Le plasmide denomme SARS-N a ete depose sous le n° 1-3048, le 5 juin 2003, aupres de la Collection Nationale 
de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient lADNc codant pour la 
proteine N de la souche de SARS-CoV issue du prelevement repertorie sous le n° 031589, telle que definie ci-dessus, 
laquelle sequence correspondant aux nucleotides des positions 28054 a 29430 (SEQ ID NO :38), en reference a la 
sequence Genbank n° d’acces AY274119.3. 

2.5) extremites 5’ et 3’ non-codantes 

a) extremite 5’non-codante (5'NC) 
a-,) synthese de lADNc 

[0194] Les ARN issus du prelevement 031589, extraits comme ci-dessus, ont ete soumis a une transcription inverse 
dans les conditions suivantes : 

[0195] L’ARN (15 pi) et I’amorce S/L/-/443 (3 pi a la concentration de 5pm, ont ete incubes 10 min a 75°C. 

[0196] Ensuite, du Tampon de transcriptase inverse 5X (6 pi, INVITROGEN), des dNTP 10 mM (1 pi), du DTT 0,1 M 
(3 pi) ont ete ajoutes et le melange a ete incube a 50°C pendant 3 min. 

[0197] Enfin la transcriptase inverse (3 pi de Superscript®, INVITROGEN) a ete ajoutee au melange precedent qui 
a ete incube a 50°C pendant 1h30 puis a 90 °C pendant 2 min. 

[0198] L’ADNc ainsi obtenu a ete purifie a I’aide du kit QIAquickPCRpurification (QIAGEN), selon les recommandations 
du fabricant. 

b^ Reaction a la Terminal Transferase (TdT) 

[0199] L’ADNc (10 pi) est incube 2 min a 100°C, conserve dans la glace, puis sont ajoutes : H 2 0 (2,5 pi), tampon TdT 
5X (4 pi, AMERSHAM), dATP 5mM (2 pi) et TdT (1,5 pi, AMERSHAM). Le melange ainsi obtenu est incube 45 min a 
37°C puis 2 min a 65°C. 

[0200] Le produit obtenu est amplifie par une premiere reaction PCR a I'aide des amorces : S/L/-/225-206 et ancre 
14T : 5’-AGATGAATTCGGTACCTTTTTTTTTTTTTT-3’ (SEQ ID NO :68). Les conditions de I’amplification sont les 
suivantes : une etape initiate de denaturation a 94°C pendant 2 min est suivie de 10 cycles comprenant une etape de 
denaturation a 94°C pendant 10 sec, une etape d’hybridation a 45°C pendant 30 sec puis une etape d’elongation a 72°C 
pendant 30 sec puis de 30 cycles comprenant une etape de denaturation a 94°C pendant 10 sec, une etape d’hybridation 
a 50°C pendant 30 sec puis une etape d’elongation a 72°C pendant 30 sec, puis d’une etape finale d'elongation a 72°C 
pendant 5 min. 

[0201] Le produit de la premiere amplification PCR a subi une seconde etape d'amplification a I’aide des amorces : 
S/L/-/204-185 et ancre 14T precitee dans des conditions identiques a celles de la premiere amplification. L'amplicon 
ainsi obtenu a ete purifie, sequence a I’aide de I'amorce S/L/-/182-163 puis il a ete clone comme ci-dessus pour les 
differentes ORF, pour donner le plasmide denomme SARS-5’NC. L’ADN de ce clone a ete isole et sequence a I’aide 
des amorces universelles M13 sens et M13 anti-sens et de I’amorce S/L/-/182-163 precitee. 

[0202] L’amplicon representant I’ADNc correspondant a I'extremite 5’NC de la souche de SARS-CoV issue du prele¬ 
vement repertorie sous le n° 031589 correspond a la sequence SEQ ID NO : 72 dans la liste de sequences jointe en 
annexe ; cette sequence ne comporte pas de differences par rapport aux sequences correspondantes des isolats 
AY274119.3-Tor2 et AY278741-Urbani. 

[0203] Le plasmide denomme SARS-5’NC a ete depose sous le n° 1-3124, Ie7 novembre2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient I’ADNc corres¬ 
pondant a I’extremite 5’non codante du genome de la souche de SARS-CoV issue du prelevement repertorie sous le 
n° 031589, telle que definie ci-dessus, laquelle sequence correspondant aux nucleotides des positions 1 a 204 (SEQ 
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ID NO :39 ), en reference a la sequence Genbank n° d’acces AY274119.3. 
b) extremite 3’non-codante (3'NC) 
a.,) synthese de I’ADNc 

[0204] Les ARN issus du prelevement 031589, extraits comme ci-dessus, ont ete soumis a une transcription inverse, 
selon le protocole suivant: le melange reactionnel contenant: ARN (5 (jlI), H 2 0 (5 |xl), tampon de transcriptase inverse 
5X (4 (xl), dNTP 5 mM (2 |xl), Oligo 20T 5|jlM (2 pi), RNasin 40 U/ pi (0,5 pi) et RT-AMV 10 III/ pi (1,5 pi, PROMEGA) 
a ete incube dans un thermocycleur, dans les conditions suivantes : 45 min a 42°C, 15 min a 55°C, 5 min a 95°C, puis 
il a ete maintenu a +4°C. 

[0205] L’ADNc obtenu a ete amplifie par une premiere reaction PCR a I’aide des amorces S/N/+/28468-28487 et 
ancre 14T precitee. Les conditions de I’amplification sont les suivantes : une etape initiale de denaturation a 94°C 
pendant 2 min est suivie de 10 cycles comprenant une etape de denaturation a 94°C pendant 20 sec, une etape 
d’hybridation a 45°C pendant 30 sec puis une etape d’elongation a 72°C pendant 50 sec puis de 30 cycles comprenant 
une etape de denaturation a 94°C pendant 20 sec, une etape d'hybridation a 50°C pendant 30 sec puis une etape 
d’elongation a 72°C pendant 50 sec, puis d’une etape finale d’elongation a 72°C pendant 5 min. 

[0206] Le produit de la premiere amplification PCR a subi une seconde etape d’amplification a I’aide des amorces 
S/N/+/28933-28952 et ancre 14T precitee, dans des conditions identiques a celles de la premiere amplification. L’am- 
plicon ainsi obtenu a ete purifie, sequence a I’aide de I’amorce S/N/+/29257-29278 et clone comme ci-dessus pour les 
differentes ORF, pour donner le plasmide denomme SARS-3’NC. L'ADN de ce clone a ete isole et sequence a I'aide 
des amorces universelles Ml3 sens et Ml3 anti-sens et de I’amorce S/N/+/29257-29278 precitee. 

[0207] L’amplicon representant I’ADNc correspondant a I'extremite 3’NC de la souche de SARS-CoV issue du prele¬ 
vement repertorie sous le n° 031589 correspond a la sequence SEQ ID NO :73 dans la liste de sequences jointe en 
annexe ; cette sequence ne comporte pas de differences par rapport aux sequences correspondantes des isolats 
AY274119.3-Tor2 et AY278741-Urbani. 

[0208] Le plasmide denomme SARS-3’NC a ete depose sous le n° 1-3123 le 7 novembre 2003, aupres de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. ; il contient la sequence 
d’ADNc correspondant a I’extremite 3’non codante du genome de la souche de SARS-CoV issue du prelevement 
repertorie sous le n° 031589, telle que definie ci-dessus, laquelle sequence correspondant a celle situee entre le nu¬ 
cleotide en position 28933 a 29727 (SEQ ID NO :40), en reference a la sequence Genbank n° d’acces AY274119.3, se 
termine par une serie de nucleotides a. 

2.6) ORFIa et ORFIb 

[0209] L’amplification de la region 5’ contenant les ORFIa et ORFIb du genome du SARS-CoV issu du prelevement 
031589 a ete realisee en pratiquant des reactions de RT-PCR suivies de PCR nichees selon les memes principes que 
ceux precedemment decrits pour les autres ORF. Les fragments amplifies sont chevauchants sur plusieurs dizaines de 
bases, permettant ainsi la reconstruction informatique de la sequence complete de cette partie du genome. En moyenne, 
les fragments amplifies sont de deux kilobases. 

[0210] 14 fragments chevauchants denommes L0 a L12 ont ainsi ete amplifiees a I’aide des amorces suivantes : 


Tableau II : Amorces utilisees pour I’amplification de la region 5’(ORF1a et ORFIb) 


REGION 

AMPLIFIEE ET 
SEQUENCEE (ne 
tient pas compte 
des amorces) 

Amorce sens RT- 

PCR 

Amorce antisens 

RT-PCR 

Amorce sens PCR 

nichee 

Amorce antisens 

PCR nichee 

L0 50-480 

S/L0/F1/+30 

S/L0/R1/-481 



LI 231-2240 

S/L1/F1/+147 

S/L1/R1/-2336 

S/L1/F2/+211 

S/L1/R2/-2241 

L2 2156-4167 

S/L2/F1/+2033 

S/L2/R1/-4192 

S/L2/F2/+2136 

S/L2/R2/-4168 

L3 3913-5324 

S/L3bis/F1/+3850 

S/L3bis/R1/-5365 

S/L3bis/F2/+3892 

S/L3bis/R2/-5325 

L4b 4952-6023 

S/L4b/F1/+4878 

S/L4b/R1/-6061 

S/L4b/F2/+4932 

S/L4b/R2/-6024 

L4 5325-7318 

S/L4/F1/+5272 

S/L4/R1/-7392 

S/L4/F2/+5305 

S/L4/R2/-7323 
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(suite) 


REGION 

AMPLIFIEE ET 
SEQUENCEE (ne 
tient pas compte 
des amorces) 

Amorce sens RT- 

PCR 

Amorce antisens 

RT-PCR 

Amorce sens PCR 

nichee 

Amorce antisens 

PCR nichee 

L5 7296-9156 

S/L5/F1/+7111 

S/L5/R1/-9253 

S/L5/F2/+7275 

S/L5/R2/-9157 

L6 9053-11066 

S/L6/F1/+8975 

S/L6/R1/-11151 

S/L6/F2/+9032 

S/L6/R2/-11067 

L7 10928-12962 

S/L7/F1/+10883 

S/L7/R1/-13050 

S/L7/F2/+10928 

S/L7/R2/-12963 

L8 12835-14834 

S/L8/F1/+12690 

S/L8/R1/-14857 

S/L8/F2/+12815 

S/L8/R2/-14835 

L9 14765-16624 

S/L9/F1/+14688 

S/L9/R1/-16678 

S/L9/F2/+14745 

S/L9/R2/-16625 

L10 16534-18570 

S/Ll 0/P1/+16451 

S/L10/R1/-18594 

S/Ll 0/F2/+16514 

S/Ll 0/R2/-18571 

L11 18521-20582 

S/Ll 1/F1/+18441 

S/Ll 1/R1/-20612 

S/Ll 1/F2/+18500 

S/Ll 1/R2/-20583 

LI 2 20338-22205. 

S/L12/F1/+20279 

S/L12/R1/-22229 

S/L12/F2/+20319 

S/L12/R2/-22206 


[0211] Tous les fragments ont ete amplifies dans les conditions suivantes, excepte le fragment L0 qui a ete amplifie 
comme decrit ci-dessus pour I’ORF-M : 

RT-PCR : 30 min a 42°C, 15 min a 55°C, 2 min a 94°C, puis I’ADNc obtenu est amplifie dans les conditions suivantes : 
40 cycles comprenant: une etape de denaturation a 94°C pendant 15 sec, une etape d’hybridation a 58°C pendant 
30 sec puis une etape d’elongation a 68°C pendant 1 min 30 sec, avec 5 sec d’elongation supplementaire a chaque 
cycle, puis une etape finale d’elongation a 68°C pendant 7 min. 

PCR nichee : une etape initiale de denaturation a 94°C pendant 2 min est suivie de 3 cycles comprenant: une etape 
de denaturation a 94°C pendant 15 sec, une etape d’hybridation a 60°C pendant 30 sec puis une etape d’elongation 
a 72°C pendant 1 min 30 sec, avec 5 sec d’elongation supplementaire a chaque cycle, puis une etape finale 
d’elongation a 72°C pendant 7 min. 

[0212] Les produits d’amplifications ont ete sequences a I’aide des amorces definies dans le Tableau III ci-apres : 


Tableau III : Amorces utilisees pour le sequengage de la region 5’ (ORF1 a et ORF1 b) 


Noms 

Sequences (SEQ ID NO : 76 a 139) 

S/L3/+/4932 

5’-CCACACACAGCTT GT GGAT A-3’ 

S/L4/+/6401 

5’-CCGAAGTTGTAGGCAATGTC-3’ 

S/L4/+/6964 

5’-TTT GGT GCTCCTT CTT ATT G-3’ 

S/L4/-/6817 

5’-CCGGCAT CCAAACAT AATTT-3’ 

S/L5/-/7633 

5’-TGGTCAGTAGGGTTGATTGG-3’ 

S/L5/-/8127 

5’-CATCCTTT GT GT CAACAT CG-3’ 

S/L5/-/8633 

5’-GT CACGAGT GACACCATCCT-3’ 

S/L5/+/7839 

5’-ATGCGACGAGTCTGCTTCTA-3’ 

S/L5/+/8785 

5'-TT CAT AGT GCCT GGCTTACC-3' 

S/L5/+/8255 

5'-AT CTT GGCGCAT GT ATT GAC-3’ 

S/L6/-/9422 

5'-TGCATTAGCAGCAACAACAT-3’ 

S/L6/-/9966 

5’-TCTGCAGAACAGCAGAAGTG-3’ 

S/L6/-/10542 

5’-CCTGTGCAGTTTGTCTGTCA-3’ 

S/L6/+/10677 

5'-CCTTGTGGCAATGAAGTACA-3’ 

S/L6/+/10106 

5'-ATGTCATTT GCACAGCAG AA-3’ 

S/L6/+/9571 

5'-CTT CAATGGTTT GCCATGTT-3’ 

S/L7/-/11271 

5’-TGCGAGCT GT CAT GAGAAT A-3’ 

S/L7/-/11801 

5'-AACCGAGAGCAGTACCACAG-3’ 
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(suite) 


Noms 

Sequences (SEQ ID NO : 76 a 139) 

S/L7/-/12383 

5’-TTTGGCTGCTGTAGTCAATG-3’ 

S/L7/+/12640 

5’-CT ACG ACAGAT GTCCTGTGC-3’ 

S/L7/+/12088 

5’-GAGCAGGCTGTAGCTAATGG-3’ 

S/L7/+/11551 

5’-TTAGGCTATT GTTGCT GOT G-3’ 

S/L8/-13160 

5’-CAGACAACAT GAAGCACCAC-3’ 

S/L8/-/13704 

5’-CGCT GACGT GAT ATATGTGG-3’ 

S/L8/-14284 

5’-TGCACAAT G AAGGAT ACACC-3’ 

S/L8/+/14453 

5’-ACAT AGCTCGCGT CT CAGTT-3’ 

S/L8/+/13968 

5’-GGCATTGTAGGCGTACTGAC-3’ 

S/L8/+/13401 

5’-GTTTGCGGT GT AAGTGCAG-3’ 

S/L9/-15098 

5’-TAGTGGCGGCTATTGACTTC-3’ 

S/L9/-15677 

5’-CTAAACCTTGAGCCGCATAG-3’ 

S/L9/-16247 

5’-CATGGT CAT AGCAGCACTT G-3’ 

S/L9/+16323 

5’-CCAGGTT GT GAT GT CACT GAT-3’ 

S/L9/+15858 

5’-CCTT ACCCAG ATCCAT CAAG-3’ 

S/L9/+15288 

5’-CGCAAACAT AACACTTGCTG-3’ 

S/Ll 0/-16914 

5’-AGT GTTGGGT ACAAGCCAGT-3’ 

S/Ll 0/-17466 

5’-GTTCCAAGGAACATGTCTGG-3’ 

S/Ll 0/-18022 

5’-AGGT GCCTGT GT AGGAT GAA-3’ 

S/Ll 0/+18245 

5’-GGGCTGTCATGCAACTAGAG-3’ 

S/Ll 0/+17663 

5’-T CTT ACACGCAATCCTGCTT-3’ 

S/Ll 0/+17061 

5’-TACCCATCTGCTCGCATAGT-3’ 

S/Ll 1 /-/18877 

5’-GCAAGCAGAATT AACCCT CA-3’ 

S/Ll 1/-19396 

5’-AGCACCACCTAAATTGCATC-3’ 

S/Ll 1 /-20002 

5’-TGGTCCCTTTGAAGGTGTTA-3’ 

S/Ll 1 /+20245 

5’-TCG AACACATCGTTT ATGGA-3’ 

S/Ll 1/+/19611 

5’-GAAGCACCT GTTT COAT CAT-3’ 

S/Ll 1/+/19021 

5’-ACGAT GOT CAGCCAT GT AGT-3’ 

SARS/L1/F3/+800 

5’-GAGGT GCAGT CACTCGCT AT-3’ 

SARS/L1/F4/+1391 

5’-CAGAGATT GGACCT GAGCAT-3’ 

SARS/L1/F5/+1925 

5’-CAGCAAACCACT CAATT COT-3’ 

SARS/L1/R3/-1674 

5 ’ - AAAT GATGGCAACCTCTTCA-3’ 

SARS/L1/R4/-1107 

5’-CACGT GGTT GAAT GACTTTG-3’ 

SARS/L1/R5/-520 

5’-ATTT CTGCAACCAGCT CAAC-3’ 

SARS/L2/F3/+2664 

5’-CGCATTGTCTCCTGGTTTAC-3’ 

SARS/L2/F4/+3232 

5’-GAGATT GAGCCAGAACCAGA-3’ 

SARS/L2/F5/+3746 

5’-AT G AGCAGGTT GT CAT GGAT-3’ 

SARS/L2/R3/-3579 

5’-CTGCCTT AAG AAGCT GGAT G-3’ 

SARS/L2/R4/-2991 

5’-TTT CTT CACCAGCAT CAT CA-3’ 

SARS/L2/R5/-2529 

5’-CACCGTT CTT GAG AACAACC-3’ 

SARS/L3/F3/+4708 

5’-TCTTTGGCTGGCTCTTACAG-3’ 

SARS/L3/F4/+5305 

5’-GCTGGT GAT GCTGCT AACTT-3’ 

SARS/L3/F5/+5822 

5’-CCAT CAAGCCT GT GTCGT AT-3’ 

SARS/L3/R3/-5610 

5’-CAGGT GGTGCAG ACAT CAT A-3’ 

SARS/L3/R4/-4988 

5’-AACAT CAGCACCAT CCAAGT-3’ 

SARS/L3/R5/-4437 

5’-ATCGGACACCATAGTCAACG-3’ 


[0213] Les sequences des fragments L0 a LI 2 de la souche de SARS-CoV issue du prelevement repertorie sous le 
n° 031589, correspondent respectivement aux sequences SEQ ID NO :41 a SEQ ID NO :54 dans la liste de sequences 
jointe en annexe. Parmi ces sequences, seule celle correspondant aux fragments L5 comporte une difference nucleo- 
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tidique par rapport a la sequence correspondante de I’isolat AY278741-Urbani. Cette mutation t/c en position 7919 
aboutit a une modification de la sequence en acides amines de la proteine correspondante, codee par I’ORF la: en 
position 2552, une valine (codon gtt; AY278741) est changee en alanine (codon get) dans la souche de SARS-CoV 
031589. En revanche, aucune mutation n’a ete identifiee par rapport a la sequence correspondante de I'isolat 
AY274119.3-Tor2. Les autres fragments ne presentent pas de differences par rapport aux sequences correspondantes 
des isolats Tor2 et Urbani. 

Exemple 2 : Production et purification de proteines N et S recombinantes de la souche de SARS-CoV issue du 
prelevement repertorie sous le numero 031589 

[0214] La proteine entiere N et deux fragments polypeptidiques de la proteine S de la souche de SARS-CoV issue 
du prelevement repertorie sous le numero 031589 ont ete produites chez E. coli, sous forme de proteines de fusion 
comprenant une etiquette polyhistidine N-ou C-terminale. Dans les deux polypeptides S, les sequences hydrophobes 
N et C-terminales de la proteine S (peptide signal: positions 1 a 13 et helice transmembranaire : positions 1196 a 1218) 
ont ete deletees alors que I’helice (3 (positions 565 a 687) et les deux motifs de type coiled-coils (positions 895 a 980 et 
1155 a 1186) de la proteine S ont ete preserves. Ces deux polypeptides sont constitues par: un fragment long (S L ) 
correspondant aux positions 14 a 1193 de la sequence en acides amines de la proteine S et un fragment court (S c ) 
correspondant aux positions 475 a 1193 de la sequence en acides amines de la proteine S. 1) Clonage des ADNc N, 
S L et S c dans les vecteurs d’expression plVEX2.3 et 

PIVEX2.4 

[0215] Les ADNc correspondant a la proteine N et aux fragments S L et S c ont ete amplifies par PCR dans des 
conditions standard, a I’aide de I’ADN polymerase Platinium Pfx® (INVITROGEN). Les plasmides SRAS-N et SRAS-S 
ont ete utilises comme matrice et les oligonucleotides suivants comme amorces : 

5’-CC CATATG TCTGATAATGGACCCCAATCAAAC-3’ (N sens, SEQ ID NO :55) 

5’-CC CCCGGG TGCCTGAGTTGAATCAGCAGAAGC-3’ (N antisens, SEQ ID NO :56) 
5’-CC CATATG AGTGACCTTGACCGGTGCACCAC-3' (S c sens, SEQ ID NO :57) 

5’-CC CATATG AAACCTTGCACCCCACCTGCTC-3’ (S L sens, SEQ ID NO :58) 

5’-CCCCCGGGTTT AAT AT ATT GOT CAT ATTTT CCC-3’ (S c et S L antisens, SEQ ID NO :59). 

[0216] Les amorces sens introduisent un site Ndel (souligne) alors que les amorces antisens introduisent un site Xmal 
ou Smal (souligne). Les 3 produits d’amplification on ete purifies sur colonne (kit QIAquick PCR Purification, QIAGEN) 
et clones dans un vecteur approprie. L’ADN plasmidique purifie des 3 constructions (kit QIAFilterMidiPlasmid, QIAGEN) 
a ete verifie par sequengage et digere par les enzymes Ndel et Xmal. Les 3 fragments correspondants aux ADNc N, 
S L et S c ont ete purifies sur gel d’agarose puis inseres dans les plasmides plVEX2.3MCS (etiquette polyhistidine C- 
terminale) et plVEX2.4d (etiquette polyhistidine N-terminale) prealablement digeres par les memes enzymes. Apres 
verification des constructions, les 6 vecteurs d’expressions ainsi obtenus (plV2.3N, plV2.3S c , plV2.3S L , plV2.4N, 
plV2.4S c egalement denomme plV2.4S|, plV2.4S L ) ont ete ensuite utilises, d’une part pour tester I’expression des 
proteines in-vitro, et d’autre part pour transformer la souche bacterienne BL21(DE3)pDIA17 (NOVAGEN). Ces cons¬ 
tructions codent pour des proteines dont la masse moleculaire attendue est la suivante : plV2.3N (47174 Da), plV2.3S c 
(82897 Da), plV2.3S L (132056 Da), plV2.4N (48996 Da), plV2.4S, (81076 Da) et plV2.4S L (133877 Da). Des bacteries 
transformees par plV2.3N ont ete deposees a la CNCM le 23 octobre 2003, sous le numero 1-3117, et des bacteries 
transformees par plV2.4S| ont ete deposees a la CNCM le 23 octobre 2003, sous le numero 1-3118. 

2) Analyse de I’expression des proteines recombinantes in-vitro et in vivo 

[0217] L’expression de proteines recombinantes a partir des 6 vecteurs recombinants a ete testee, dans un premier 
temps, dans un systeme in-vitro (RTS100, Roche). Les proteines produites in vitro, apres une incubation des vecteurs 
recombinants pIVEX, 4h a 30°C, dans le systeme RTS100, ont ete analysees par western-blot a I’aide d’un anticorps 
anti-(his) 6 couple a la peroxydase. Le resultat d’expression in-vitro (Figure 1) montre que seule la proteine N est exprimee 
en quantites importantes, cela quelle que soit la position, N- ou C-terminale, de I’etiquette polyhistidine. Dans une 
seconde etape, I’expression des proteines N et S a ete testee in-vivo a 30°C dans du milieu LB, en presence ou en 
I’absence d’inducteur (IPTG ImM). La proteine N est tres bien produite dans ce systeme bacterien (Figure 2) et se 
retrouve principalement dans une fraction soluble apres lyse des bacteries. En revanche, la version longue de S (S L ) 
est tres peu produite et completement insoluble (Figure 3). La version courte (S c ) presente egalement une tres faible 
solubilite, mais un taux d’expression beaucoup plus eleve que celui de la version longue. Par ailleurs, la construction 
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S c fusionnee a une etiquette polyhistidine en position C-terminale presente une taille plus faible que celle attendue. 
Une experience d’immunodetection avec un anticorps anti-polyhistidine a montre que cette construction etait incomplete. 
En conclusion, les deux constructions, plV2.3N et plV2.4S|, exprimant respectivement la proteine N entiere fusionnee 
a I’etiquette polyhistidine en C-terminal et la proteine S courte fusionnee a I’etiquette polyhistidine en N-terminal, ont 
ete retenues pour produire les deux proteines en grande quantite afin de les purifier. Les plasmides plV2.3N et plV2.4S| 
ont ete deposes respectivement sous le n° 1-3117 et 1-3118 aupres de la CNCM, 25 rue du Docteur Roux, 75724 PARIS 
15, le 23 octobre 2003. 

3) Analyse de I’activite antigenique des proteines recombinantes 

[0218] L’activite antigenique des proteines N, S L et S c a ete testee par western-blot, a I’aide de deux echantillons de 
serum, provenant d'un meme patient infecte par le SARS-CoV, preleves 8 jours (M12) et 29 jours-(M13) apres le debut 
des symptomes du SRAS. Le protocole experimental est comme decrit a I’exemple 3. Les resultats illustres par la figure 
4 montrent (i) la seroconversion du patient, et (ii) que la proteine N possede une plus forte reactivite antigenique que la 
proteine S courte. 

4) Purification de la proteine N a partir de plV2.3N 

[0219] Plusieurs experiences de purification de la proteine N, produite a partir du vecteur plV2.3N, ont ete realisees 
selon le protocole suivant. Les bacteries BL21(DE3)pDIA17, transformees par le vecteur d'expression plV2.3N, ont ete 
cultivees a 30°C dans 1 litre de milieu de culture contenant 0,1 mg/ml d’ampicilline, et induites par 1 mM IPTG quand 
la densite cellulaire, equivalente a A 600 = 0,8, est atteinte (environ 3 heures). Apres 2 heures de culture en presence 
d’inducteur, les cellules ont ete recuperees par centrifugation (10 min a 5000 rpm), remises en suspension dans le 
tampon de lyse (50 mM NaH 2 P0 4 , NaCI 0,3 M, 20 mM imidazole, pH 8 contenant le melange d’inhibiteurs de proteases 
Complete®, Roche), et lysees par la presse de French (12000 psi). Apres centrifugation du lysat bacterien (15 min a 
12000 rpm), le surnageant (50 ml) a ete depose a un debit de Iml/min sur une colonne (15 ml) de chelation metallique 
(Ni-NTA superflow, Qiagen), equilibree par le tampon de lyse. Apres lavage de la colonne par 200 ml de tampon de 
lyse, la proteine N a ete eluee par un gradient d’imidazole (20 —>250 mM) en 10 volumes de colonne. Les fractions 
contenant la proteine N ont ete rassemblees et analysees par electrophorese en gel de polyacrylamide en conditions 
denaturantes puis coloration au bleu de Coomassie. Les resultats illustres par la figure 5 montrent que le protocole 
employe permet de purifier la proteine N avec une homogeneite tres satisfaisante (95%) et un rendement moyen de 15 
mg de proteine par litre de culture. 

5) Purification de la proteine S c a partir de plV2.4S c (plV2.4S|) 

[0220] Le protocole suivi pour purifier la proteine S courte est tres different de celui decrit ci-dessus car la proteine 
est fortement agregee dans le systeme bacterien (corps d’inclusion). Les bacteries BL21(DE3)pDIA17, transformees 
par le vecteur d’expression plV2.4S| ont ete cultivees a 30°C dans 1 litre de milieu de culture contenant 0,1 mg/ml 
d’ampicilline, et induites par 1 mM IPTG quand la densite cellulaire, equivalente a A 600 = 0,8, est atteinte (environ 3 
heures). Apres 2 heures de culture en presence d’inducteur, les cellules ont ete recuperees par centrifugation (10 min 
a 5000 rpm), remises en suspension dans le tampon de lyse (0,1 M Tris-HCI, EDTA 1 mM, pH 7,5), et lysees par la 
presse de French (1200 psi). Apres centrifugation du lysat bacterien (15 min a 12000 rpm), le culot a ete remis en 
suspension dans 25 ml de tampon de lyse contenant 2% Triton XI00 et 10 mM (S-mercaptoethanol, puis centrifuge 
pendant 20 min a 12000 rpm. Le culot a ete remis en suspension dans un tampon Tris-HC110 mM contenant 7 M uree, 
et mis en agitation douce pendant 30 min a temperature ambiante. Ce dernier lavage des corps d’inclusion avec 7 M 
uree est necessaire pour eliminer la plupart des proteines membranaires d’E. co//qui co-sedimentent avec la proteine 
S c agregee. Apres une derniere centrifugation pendant 20 min a 12000 rpm, le culot final est remis en suspension dans 
le tampon Tris-HC110 mM. L’analyse electrophoretique de cette preparation (Figure 6) montre que la proteine S courte 
peut etre purifiee avec une homogeneite satisfaisante (environ 90%) a partir des corps d’inclusion (extrait insoluble). 

Exemple 3 : Immunodominance de la proteine N 

[0221] La reactivite des anticorps presents dans le serum des patients atteints de pneumopathie atypique causee par 
le coronavirus associe au SRAS (SARS-CoV), vis-a-vis des differentes proteines de ce virus, a ete analysee par western- 
blot dans les conditions decrites ci-apres. 
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1) Materiel 

a) lysat de cellules infectees par le SARS-CoV 

[0222] Des cellules Vero E6 (2x10 6 ) ont ete infectees par le SARS-CoV (isolat repertorie sous le numero FFM/MA104) 
a une multiplicite d’infection (M.O.I.) de 10 _1 ou 10 -2 puis incubees dans du milieu DMEM contenant2% de SVF, a 35°C 
dans une atmosphere contenant 5% de C0 2 . 48 heures plus tard, le tapis cellulaire a ete lave avec du PBS puis lyse 
avec 500 |xl de tampon de depot prepare selon Laemmli et contenant du P-mercaptoethanol. Les echantillons ont ensuite 
ete bouillis 10 minutes puis soniques 3 fois 20 secondes. 

b) anticorps 

b.,) serum de patient atteint de pneumopathie atypique 

[0223] Le serum reference au Centre National de Reference des virus influenzae (Region-Nord) sous le N° 20033168 
est celui d’un patient frangais atteint d’une pneumopathie atypique causee par le SARS-CoV preleve au jour 38 apres 
le debut des symptomes ; le diagnostic d’infection par le SARS-CoV a ete realise par RT-PCR nichee et PCR quantitative. 

b 2 ) serums polyclonaux de lapin monospecifiques diriges contre la proteine N ou la proteine S 

[0224] Les serums sont ceux produits a partir des proteines recombinantes N et S c (exemple 2), selon le protocole 
d’immunisation decrit a I’exemple 4 ; il s’agit du serum du lapin PI 3097 (serum anti-N) et du serum du lapin P11135 
(serum anti-S). 

2) Methode 

[0225] 20 |xl de lysat de cellules infectees par le SARS-CoV a des M.O.I. de 10 _1 et 10 -2 et, a titre de controle, 20 pi 

d’un lysat de cellules non infectees (mock) ont ete separes sur un gel SDS a 10% de polyacrylamide puis transferee 
sur une membrane de nitrocellulose. Apres blocage dans une solution de PBS/lait 5%/Tween 0,1% et lavage en PBS/ 
Tween 0,1%, cette membrane a ete hybridee pendant une nuit a 4°C avec : (i) I’immun-serum N° 20033168 dilue au 
1/300, 1/1000 et 1/3000 dans le tampon PBS/BSA 1%/Tween 0,1%, (ii) le serum du lapin P13097 (serum anti-N) dilue 
au 1/50000 dans le meme tampon et (iii) le serum du lapin P11135 (serum anti-S) dilue au 1/10000 dans le meme 
tampon. Apres lavage en PBS/Tween, une hybridation secondaire a ete realisee a I’aide, soit d’anticorps polyclonaux 
de mouton diriges contre les chaTnes lourdes et legeres des immunoglobulines G humaines et couples a la peroxidase 
(NA933V, Amersham), soit d’anticorps polyclonaux d’ane diriges contre les chaTnes lourdes et legeres des immunoglo¬ 
bulines G de lapin et couples a la peroxidase (NA934V, Amersham). Les anticorps fixes ont ete reveles a I’aide du kit 
ECL+ (Amersham) et de films d’autoradiographie Hyperfilm MP (Amersham). Une echelle de masse moleculaire (kDa) 
est portee sur la figure. 

3) Resultats 

[0226] La figure 7 montre que trois polypeptides de masse moleculaire apparente 35, 55 et 200 kDa sont detectes 
specifiquement dans les extraits de cellules infectees par le SARS-CoV. 

[0227] Afin d'identifier ces polypeptides, deux autres immunoempreintes (figure 8) ont ete realisees sur les memes 
echantillons et dans les memes conditions avec des anticorps polyclonaux de lapins specifique de la nucleoproteine N 
(lapin PI 3097, figure 8A) et de la proteine de spicule S (lapin P11135, figure 8B) Cette experience montre que le 
polypeptide de 200 kDa correspond a la glycoproteine de spicule S du SARS-CoV, que le polypeptide de 55 kDa 
correspond a la nucleoproteine N tandis que le polypeptide de 35 kDa represente vraisemblablement une forme tronquee 
ou degradee de la N. 

[0228] Les donnees presentees dans la figure 7 montrent done que le serum 20033168 reagit fortement avec la N et 
beaucoup plus faiblement avec la S du SARS-CoV, puisque les polypeptides de 35 et 55 kDa sont reveles sous la forme 
de bandes intenses pour des dilutions de 1/300, 1/1000 et 1/3000 de I’immunserum alors que le polypeptide de 200 
kDa n’est que faiblement revele pour une dilution de 1/300. On peut noter egalement qu’aucun autre polypeptide du 
SARS-CoV n’est detecte pour des dilutions superieures au 1/300 du serum 20033168. 

[0229] Cette experience indique que la reponse en anticorps specifique de la N du SARS-CoV domine les reponses 
en anticorps specifiques des autres polypeptides du SARS-CoV et en particulier la reponse en anticorps dirigee contre 
la glycoproteine S. Elle indique une immunodominance de la nucleoproteine N lors des infections humaines par le SARS- 
CoV. 
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Exemple 4 : Reparation d’anticorps polyclonaux monospecifiques diriges contre les proteines N et S du co- 
ronavirus associe au SRAS (SARS-CoV) 

1) Materiel et methode 

[0230] Trois lapins (PI 3097, PI 3081, PI 3031) ont ete immunises avec le polypeptide recombinant purifie correspon¬ 
dent a I’integralite de la nucleoproteine (N), prepare selon le protocole decrit a I’exemple 2. Apres une premiere injection 
de 0,35 mg par lapin de proteine emulsionnee en adjuvant complet de Freund (voie intradermique), les animaux ont 
regus 3 injections de rappel a 3 puis 4 semaines d'intervalle, de 0,35 mg de proteine recombinante emulsionnee en 
adjuvant incomplet de Freund. 

[0231] Trois lapins (P11135, PI3042, PI4001) ont ete immunises avec le polypeptide recombinant correspondant au 
fragment court de la proteine S (S c ), produit comme decrit a I’exemple 2. Comme ce polypeptide est retrouve principa- 
lement sous la forme de corps d’inclusion dans le cytoplasme bacterien, les animaux ont regus 4 injections intra-dermiques 
a 3-4 semaines d’intervalle d’une preparation de corps d’inclusion correspondant a 0,5 mg de proteine recombinante 
emulsionnee en adjuvant incomplet de Freund. Les 3 premieres injections ont ete realisees avec une preparation de 
corps d’inclusion prepares selon le protocole decrit a I’exemple 2, tandis que la quatrieme injection a ete realisee avec 
une preparation de corps d’inclusion qui ont ete prepares selon le protocole decrit a I’exemple 2 puis purifies sur gradient 
de saccharose et laves en 2 % Triton XI00. 

[0232] Pour chaque lapin, un serum pre-immun (p.i.) a ete prepare avant la premiere immunisation et un immun- 
serum (I.S.) 5 semaines apres la quatrieme immunisation. 

[0233] Dans un premier temps, la reactivite des serums a ete analysee par test ELISA vis a vis de preparations de 
proteines recombinantes semblables a celles utilisees pour les immunisations ; les tests ELISA ont ete realises selon 
le protocole et avec les reactifs tels que decrits a I’exemple 6. 

[0234] Dans un deuxieme temps, la reactivite des serums a ete analysee en realisant une immunoempreinte (western 
blot) d’un lysat de cellules infectees par le SARS-CoV, en suivant le protocole tel que decrit a I’exemple 3. 

2) Resultats 

[0235] Les tests ELISA (figure 9) demontrent que les preparations de proteine N recombinante et de corps d’inclusion 
du fragment court de la proteine S (S c ) sont immunogenes chez I'animal et que le titre des serums immuns est eleve 
(plus de 1/25000). 

[0236] L’immunoempreinte (figure 8) montre que le serum immun du lapin PI 3097 reconnaTt deux polypeptides pre¬ 
sents dans les lysats de cellules infectees par le SARS-CoV : un polypeptide dont la masse moleculaire apparente 
(50-55 kDa selon les experiences) est compatible avec celle de la nucleoproteine N (422 residus, masse moleculaire 
predite de 46 kDa) et un polypeptide de 35 kDa, qui represente vraisemblablement une forme tronquee ou degradee 
de la N. 

[0237] Cette experience montre egalement que le serum du lapin P11135 reconnaTt principalement un polypeptide 
dont la masse moleculaire apparente (180-220 kDa selon les experiences) est compatible avec une forme glycosylee 
de la S (1255 residus, chaTne polypeptidique non glycosylee de 139 kDa), ainsi que des polypeptides plus legers, qui 
represented vraisemblablement des formes tronquees et/ou non glycosylees de la S. 

[0238] En conclusion, I'ensemble de ces experiences demontrent que des polypeptides recombinants exprimes chez 
E. colie t correspondant aux proteines N et Sdu SARS-CoV permettentd’induire chez I'animal des anticorps polyclonaux 
capables de reconnaTtre les formes natives de ces proteines. 

Exemple 5 : Preparation d’anticorps polyclonaux monospecifiques diriges contre les proteines M et E du 
coronavirus associe au SRAS (SARS-CoV) 

1) Analyse de la structure des proteines M et E 

a) Proteine E 

[0239] La structure de la proteine E du SARS-CoV (76 acides amines) a ete analysee in silico , a I’aide de differents 
logiciels comme signalP vl.1, NetNGIyc 1.0, THMM 1.0 et 2.0 (Krogh et al., 2001, J. Mol. Biol., 305(3):567-580) ou 
encore TOPPRED (von Heijne, 1992, J. Mol. Biol. 225, 487-494). L'analyse montre que ce polypeptide non glycosyle 
est une proteine membranaire de type 1, contenant une seule helice transmembranaire (aa 12-34 d'apres THMM), et 
dont la plus grande partie du domaine hydrophile (42 residus) est localisee a I’extremite C-terminale et vraisemblablement 
a I’interieur de la particule virale (endodomaine). On peut noter une inversion dans la topologie predite par les versions 
1.0 (N-terest externe) et 2.0 (N-ter est interne) du logiciel THMM, mais que d'autresalgorithmes, notamment TOPPRED 
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et THUMBUP (Zhou et Zhou, 2003, Protein Science 12 :1547-1555) confirment une localisation externe de I’extremite 
N-terminale de E. 

b) Proteine M 

[0240] Une analyse similaire realisee sur la proteine M du SARS-CoV (221 acides amines) montre que ce polypeptide 
ne possede pas de peptide signal (d’apres le logiciel signalP vl.1) mais trois domaines transmembranaires (residus 
15-37, 50-72, 77-99 d’apres THMM2.0) et un grand domaine hydrophile (aa 100-221) localise a I’interieur de la particule 
virale (endodomaine). Elle est vraisemblablement glycosylee sur I'asparagine en position 4 (d'apres NetNGIyc 1.0). 
[0241] Ainsi, en accord avec les donnees experimental connues pour les autres coronavirus, il est remarquable 
que les deux proteines M et E presentent des endodomaines correspondant a la majeure partie des polypeptides et des 
ectodomaines de tres petite taille. 

I’ectodomaine de E correspond vraisemblablement aux residus 1 a 11 ou 1 a 12 de la proteine : MYSFVSEETGT 
(L), SEQ ID NO : 70. En effet, la probability associee a la localisation transmembranaire du residu 12 est intermediate 
(0,56 d’apres THMM 2.0). 

I’ectodomaine de M correspond vraisemblablement aux residus 2 a 14 de la proteine : ADNGTITVEELKQ, SEQ ID 
NO : 69. En effet, la methionine N-terminale de M est tres probablement clivee du polypeptide mature car le residu 
en position 2 est une Alanine (Varshavsky, 1996, 93:12142-12149). 

[0242] Par ailleurs, I’analyse de I’hydrophobicite (Kyte & Doolittle, Hopp & Woods) de la proteine E met en evidence 
que I’extremite C-terminale de I’endodomaine de E est hydrophile et done vraisemblablement exposee a la surface de 
ce domaine. Ainsi, un peptide synthetique correspondant a cette extremity est un bon candidat immunogene pourinduire 
chez I’animal des anticorps diriges contre I’endodomaine de E. En consequence, un peptide correspondant aux 24 
residus C-terminaux de E a ete synthetise. 

2) Preparation d’anticorps diriges contre I’ectodomaine des proteines M et E et I’endodomaine de la proteine E 

[0243] Les peptides M2-14 (ADNGTITVEELKQ, SEQ ID NO : 69), El-12 (MYSFVSEETGTL, SEQ ID NO: 70) et 
E53-76 (KPTVYVYSRV KNLNSSEGVP DLLV, SEQ ID NO : 71) ont ete synthetises par Neosystem. Ils ont ete couples 
a la KLH (Keyhole Limpet Heinocyanin) a I’aide du MBS (m-maleimidobenzoyl-N-hydroxysuccinimide ester) via une 
cysteine ajoutee au cours de la synthese soit en N-terminal du peptide (cas de E53-76) soit en C-terminal (cas de M2-14 
et El-12). 

[0244] Deux lapins ont ete immunises avec chacun des conjugues, en suivant le protocole d’immunisation suivant: 
apres une premiere injection de 0,5 mg de peptide couple a la KLH et emulsionne en adjuvant complet de Freund (voie 
intradermique), les animaux regoivent 2 a 4 injections de rappel a 3 ou 4 semaines d’intervalle de 0,25 mg de peptide 
couple a la KLH et emulsionne en adjuvant incomplet de Freund. 

[0245] Pour chaque lapin, un serum pre-immun (p.i.) a ete prepare avant la premiere immunisation et un immun- 
serum (I.S.) est prepare 3 a 5 semaines apres les injections de rappel. 

[0246] La reactivity des serums a ete analysee par western blot a I’aide d’extraits de cellules infectees par le SRAS- 
CoV (figure 43B) ou a I’aide d’extraits de cellules infectees par un virus recombinant de la vaccine exprimant la proteine 
E (VV-TG-E, figure 43A) ou M (VV-TN-M, figure 43C) de I’isolat 031589 du SRAS-CoV. 

[0247] Les immunserums des lapins 22234 et 22240, immunises par le conjugue KLH-E53-76, reconnaissent un 
polypeptide d’environ 9 a 10kD, qui est present dans les extraits de cellules infectees par le SRAS-CoV mais absent 
dans les extraits de cellules non infectees (figure 43B). La masse apparente de ce polypeptide est compatible avec la 
masse predite de la proteine E, qui est de 8,4 kD. De fagon similaire, I’immunserum du lapin 20047, immunise par le 
conjugue KLH-E1-12, reconnaTt un polypeptide present dans les extraits de cellules infectees par le virus VV-TG-E, 
dont la masse molaire apparente est compatible avec celle de la proteine E (figure 43A). 

[0248] L’immunserum des lapin 20013 et 20080, immunises par le conjugue KLH-M2-14, reconnaTt un polypeptide 
present dans les extraits de cellules infectees par le virus VV-TN-M (figure 43C), dont la masse molaire apparente (18 
kD environ) est compatible avec celle de la glycoproteine M, qui est de 25,1 kD et presente un point isoelectrique eleve 
(9.1 pour le polypeptide nu). 

[0249] Ces resultats demontrent que les peptides El-12 et E53-76 d'une part et le peptide M2-14 d’autre part permettent 
d’induire chez I’animal des anticorps polyclonaux capables de reconnaTtre les formes natives des proteines E et M 
respectivement du SRAS-CoV. 
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Exemple 6 : Analyse de la reactivite en ELISA de la proteine N recombinante, vis-a-vis de serums de patients 
atteints de SRAS 

1) Materiel 

[0250] L’antigene utilise pour preparer les phases solides est la nucleoproteine N recombinante purifiee preparee 
selon le protocole decrit a I’exemple 2. 

[0251] Les serums a tester (Tableau IV) ont ete choisis sur la base des resultats d’analyse de leur reactivite par 
immunofluorescence (titre IF-SRAS), vis-a-vis de cellules infectees par le SARS-CoV. 


Tableau IV: Serums testes en ELISA 


Reference 

N° serum 

Type de serum 

Date du Serum*** 

Titre IF-SRAS 

3050 

A 

Temoin 

na* 

nt** 

3048 

B 

Temoin 

na 

nt 

033168 

D 

Patient 1-SRAS 

27/04/03 (J38) 

320 

033397 

E 

Patient-1 SRAS 

11/05/03 (J52) 

320 

032632 

F 

Patient-2 SRAS 

21/03103 (J17) 

2500 

032791 

G 

Patient-3 SRAS 

04/04/03 (J3) 

<40 

033258 

H 

Patient-3 SRAS 

28/04/03 (J27) 

160 

*na : non-applicable. ** nt: non-teste. *** les dates indiquees correspondent au nombre 
de jours apres le debut des symptomes de SRAS. 


2) Methode 

[0252] La proteine N (100 |xl) diluee a differentes concentrations dans du tampon carbonate 0,1 M, pH 9,6 (1,2 ou 4 
(jL,g/ml) est distribute dans les puits de plaques ELISA, puis les plaques sont incubees une nuit a temperature du 
laboratoire. Les plaques sont lavees avec du tampon PBS-Tween, saturees avec du tampon PBS-lait ecreme-saccharose 
(5 %). Les serums a tester (100 |xl) prealablement dilues (1/50, 1/100, 1/200, 1/400, 1/800, 1/1600 et 1/3200) sont 
ajoutes, puis les plaques sont incubees 1 h a 37° C. Apres 3 lavages, le conjugue anti-IgG humaines marque a la 
peroxydase (reference 209-035-098, JACKSON) dilue au 1/18000 est ajoute puis les plaques sont incubees 1h a 37 
°C. Apres 4 lavages, le chromogene (TMB) et le substrat (H 2 0 2 ) sont ajoutes et les plaques sont incubees 30min a 
temperature ambiante, a I’abri de la lumiere. La reaction est ensuite arretee puis I’absorbance a 450 nm est mesuree 
a I’aide d’un lecteur automatique. 

3) Resultats 

[0253] Les tests ELISA (figure 10) demontrent que la preparation de proteine N recombinante est reconnue specifi- 
quement par les anticorps de serums de patients atteints de SRAS preleves en phase tardive de I’infection (> 17 jours 
apres le debut des symptomes) alors qu’elle n’est pas reconnue de fagon significative par les anticorps d’un serum de 
patient preleve en phase precoce de I’infection (3 jours apres le debut des symptomes) ni par des serums temoins de 
sujets non atteints de SRAS. 

Exemple 7 : Tests ELISA elabores pour une detection tres specifique et sensible d’une infection par le coro- 
navirus associe au SRAS, a partir de serums de patients 

1) Test ELISA IgG indirect 

a Reactifs 


Preparation des plaques 

[0254] Les plaques sont sensibilisees par une solution de proteine N a 2|xg/mL dans un tampon PBS lOmM pH 7,2, 
rouge de phenol a 0,25mL /L. 100 (jlL de solution sont deposes dans les puits et laisses incubes a temperature ambiante 
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pendant une nuit. La saturation se fait par un prelavage en tampon PBS 10mM / tween 0,1%, suivi d’un lavage avec 
une solution de saturation PBS, 25% lait /saccharose. 

Diluant serums 

[0255] Tampon TRIS 0,48g/L, PBS lOmM, EDTA 3,7g/L,lait 15% v/v , pH 6,7 
Diluant conjugue 

[0256] Tampon citrate (15g/L), tween 0,5% , serum bovin 25%, NaCI 12%, lait ecreme 6% v/v PH 6,5 
Conjugue 

[0257] Conjugue anti-IgG humaines 50X, commercialises par Bio-Rad : kit Platelia H. pylori ref 72778 
Autres solutions: 

[0258] Solution de lavage R2, Solutions de revelation au TMB R8 diluant, R9 chromogene, R10 solution d’arret: 
reactifs commercialises commercialisees par Bio-Rad (ex : kit Platelia pylori, ref 72778) 

b) Mode operatoire 

[0259] 

Diluer les serums au 1/200 dans le diluant echantillons 
Distribuer 100(jiL/puits 
Incubation 1h a 37°C 

3 lavages en solution de LAVAGE R2 lOxprealablementdiluee lOfois en eau demineralisee (i.e., solution de lavage 
IX) 

Distribuer 100|j,L de conjugue (conjugue 50x a diluer extemporanement dans le diluant conjugue fourni) 
Incubation 1h a 37°C 

4 lavages en solution de lavage IX 

distribuer 200|a,L/puits de solution de revelation (a diluer extemporanement ex: mL de R9 dans 10mL de R8) 
Incubation 30 min a temperature ambiante a I’obscurite 
arreter la reaction avec 100|mL/puits de R10 
LECTURE a 450/620nm 

[0260] Les resultats peuvent etre interprets en prenant un serum SEUIL donnant une reponse au dela de laquelle 
les serums testes seront consideres comme positifs. Ce serum est choisi et dilue de fagon a donner un signal signifi- 
cativement superieur au bruit de fond. 

2) Test ELISA DOUBLE EPITOPE 

a Reactifs 


Preparation des plaques 

[0261] Les plaques sont sensibilisees par une solution de proteine N a 1|a,g/mL dans un tampon PBS lOmM pH 7,2, 
rouge de phenol a 0,25mL /L. 100 |j,L de solution sont deposes dans les puits et laisses incubes a temperature ambiante 
pendant une nuit. La saturation se fait par un prelavage en tampon PBS 10mM / 0,1% tween suivi d’un lavage avec 
une solution de saturation PBS 10mM, lait 25% (V/V) 

Diluant serums et conjugue 

[0262] Tampon TRIS saline 50mMpH8, lait 2% 
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Conjugue 

[0263] II s’agit de la proteine N recombinante purifiee, couplee a la peroxidase selon le protocole de Nakane (Nalcane 
P.K. and Kawaoi A; (1974) : Peroxydase-labeled antibody, a new method of conjugation. The Journal of Histochemistry 
and Cytochemistry Vol22, N)23, pp 1084-1091.), dans des ratios molaires respectifs 1/2. Ce conjugue ProtN POD est 
utilise a une concentration de 2|xg/mL dans du diluant serum/conjugue. 

Autres solutions: 

[0264] Solution de lavage R2, Solutions de revelation au TMB R8, diluant, R9 chromogene, RIO solution d’arret: 
reactifs commercialisees par Bio-Rad (ex kit platelia pylori ref 72778). 

b) Mode operatoire 

lere etape en plaque de "predilution'' 

[0265] 

■ Diluer chaque serum au 1/5 dans la plaque de predilution (48 |xl_ de diluant +12 |j,L de serum). 

■ Apres avoir dilues I’ensemble des serums, distribuer 60|xL de conjugue 

■ Le cas echeant, le melange serum + conjugue est laisse a incuber. 

2eme etape en plaque de "reaction" 

[0266] 

■ Transferer 100|xLde melange/puits dans la plaque de reaction 

■ Incubation 1h 37°C 

■ 5 lavages en solution de LAVAGE R2 lOx prealablement diluee 10 fois en eau demineralisee (-> solution de 
lavage lx) 

■ distribuer 200|a.L/puits de solution de revelation (a diluer extemporanement ex:l mL de R9 dans 10mL de R8) 

■ incubation 30min a temperature ambiante a I’abri de la lumiere 

■ arreter la reaction avec 100p.L/puits de R10 

■ LECTURE a 450/620nm 

[0267] De meme que pour le test ELISA indirect, les resultats peuvent etre interprets en utilisant un serum "valeur 
seuil". Tout serum ayant une reponse superieure au serum valeur seuil sera considere comme positif. 

2) Resultats 

[0268] Les serums de patients classes comme cas probables de SRAS de I’hopital frangais de Hanoi, Vietnam ou en 
relation avec I’hopital frangais de Hanoi (JYK) ont ete analyses en utilisant le test IgG-N indirect et le test N double epitope. 
[0269] Les resultats du test IgG-N indirect (figures 14 et 15) et N double epitope (figures 16 et 17) montrent une 
excellente correlation entre eux ainsi qu’avec un test ELISA indirect comparant la reactivite des serums vis-a-vis d'un 
lysat de cellules VeroE6 non infectees ou infectees par le SRAS-CoV (ELISA-lysat SRAS-CoV ; voir le Tableau V ci- 
apres). Tous les serums preleves 12 jours ou plus apres le debut des symptomes ont ete trouves positifs, y compris 
chez des patients pour lesquels I'infection par le virus du SRAS-CoV n’avait pas pu etre documentee par analyse de 
prelevements respiratoires par RT-PCR, vraisemblablement en raison d’un prelevement trap tardif au cours de I’infection 
(> J12). Dans le cas du patient TTH pour lequel un prelevement nasal realise a J7 a ete trouve negatif par RT-PCR, la 
qualite du prelevement pourrait etre en cause. 

[0270] Certains serums ont ete trouves negatifs alors que la presence de SRAS-CoV a ete detectee par RT-PCR. II 
s’agit dans tous les cas de serums precoces preleves moins de 10 jours apres le debut des symptomes (ex : serum # 
032637). Dans le cas d'un patient PTTH (serum # 032673), seule une suspicion de SRAS etait evoquee au moment oil 
les prelevements ont ete realises. 

[0271] En conclusion, les tests serologiques IgG-N indirect et N-double epitope permettent de documenter I’infection 
par le SRAS-CoV chez tous les patients pour des serums preleves 12 jours ou plus apres I’infection. 
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Tableau V : Resultats des tests ELISA 


Num Pvt 

Patient 

Jour 

PCR-SARS (1) 

ELISA lysat 
SRAS-CoV (2) 

IgG-N (2® me serie) 

2Xepitope (2® me 
serie) 

033168 

JYK 

38 

POS 

++ + 

>5000 

NT 

033597 

JYK 

74 

POS 

NT 

» 5000 

NT 

032552 

VTT 

8 

NEG-J3&J8&J12 

NEG 

<200 

<5 

032544 

CTP 

16 

NEG J16&J20 

++ 

>5000 

»20 

032546 

CJF 

15 

NEG J15&J19 

+ + 

>5000 

»20 

032548 

PTL 

17 

NEG J17&J21 

++ 

>5000 

»20 

032550 

NTH 

17 

NEG-J17&J21 

++ 

>5000 

»20 

032553 

VTT 

8 

NEG-J3&J8&J12 

NEG 

<200 

<5 

032554 

NTBV 

4 

POS 

NEG 

<200 

<5 

032555 

NTBV 

4 

POS 

NEG 

<200 


032564 

NTP 

15 

POS 

++ 

>5000 

»20 

032629 

NVH 

4 

POS 

NEG 

<200 

<5 

032631 

BTTX 

9 

POS 

NEG 

<200 

<5 

032635 

NHH 

4 

POS 

NEG 

<200 

<5 

032637 

NHB 

10 

POS 

NEG 

<200 

<5 

032642 

BTTX 

9 

POS 

NEG 

<200 

<5 

032643 

LTDH 

1 

POS 

NEG 

<200 

<5 

032644 

NTBV 

4 

POS 

NEG 

<200 

<5 

032646 

TTH 

12 

NEG J7&J12&J16 

+ + 

>5000 

»20 

032647 

DTH 

17 

NEG J17&J21 

+ + 

>5000 

»20 

032648 

NNT 

15 

NEG J15&J19 

++ 

>5000 

»20 

032649 

PTH 

17 

NEG J17&J21 

++ 

>5000 

»20 

032672 

LVV 

16 

NEG J16&J20 

+ 

>5000 

»20 

032673 

PTTH 

NA 

NEG 

NEG 

<200 

<5 

032674 

PNB 

17 

NEG J17&J21 

++ 

>5000 

»20 

032682 

VTH 

12 

NEG J12&J16 

++ 

>5000 

»20 

032683 

DTV 

17 

NEG J17&J21 

+ 

>1000 

»20 

Notes: 

(1) : Les analyses par RT-PCR ont ete realisees par RT-PCR nichee BNI, LC Artus et LC-N sur des ecouvillonnages 
nasaux ou pharynges; POS signifie qu'au moins un prelevement a ete trouve positif chez ce patient. 

(2) : La reactivite des serums dans le test ELISA utilisant un lysat de cellules infectees par le SRAS-CoV a ete classee 
en tres fortement reactif (+++), fortement reactif (++), reactif (+) et negatif en fonction de la valeur DO obtenue aux 
dilutions testees 
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Exemple 8 : Detection du coronavirus associe au SRAS (SARS-CoV) par RT-PCR 

1) Mise au point de conditions de RT-PCR en temps reel a I’aide d’amorces specifiques du gene de la proteine 
de nucleocapside - test "Light Cycler N" 

a) conception des amorces et des sondes 

[0272] La conception des amorces et sondes a ete realisee a partir de la sequence du genome de la souche de SARS- 
CoV issue du prelevement repertorie sous le numero 031589, a I’aide du programme "Light Cycler Probe Design (Roche)". 
Ainsi les deux series d’amorces et de sondes suivantes ont ete selectionnees : 

- serie 1 (SEQ ID NO : 60, 61, 64, 65): 

[0273] 

- amorce sens : N/+/28507 : 5’-GGC ATC GTA TGG GTT G-3' [28507-28522] 

- amorce antisens : N/-/28774 : 5’-CAG TTT CAC CAC CTC C-3’ [28774-28759] 

- sonde 1 : 5’-GGC ACC CGC AAT CCT AAT AAC AAT GC-fluoresceine 3’ [28561-28586] 

- sonde 2 : 5’ Red705 -GCC ACC GTG CTA CAA CTT CCT-phosphate [28588-28608] 

- serie 2 (SEQ ID NO : 62, 63, 66, 67) 

[0274] 

- amorce sens : N/+/28375 : 5’-GGC TAC TAC CGA AGA G-3’ [28375-28390] 

- amorce antisens : N/-/28702 : 5’-AAT TAC CGC GAC TAC G-3’ [28702-28687] 

- sonde 1 : SRAS/N/FL : 5’-ATA CAC CCA AAG ACC ACA TTG GC - fluoresceine 3’ [28541-28563] 

- sonde 2 : SRAS/N/LC705 : 5’ Red705 -CCC GCA ATC CTA ATA ACA ATG CTG C-phosphate 3’ [28565-28589] 

b) analyse de I’efficacite des deux couples amorces 

[0275] Afin de tester I’efficacite respective des deux couples d’amorces, une amplification par RT-PCR a ete realisee 
sur un ARN synthetique correspondant aux nucleotides 28054-29430 du genome de la souche de SARS-CoV issue du 
prelevement repertorie sous le numero 031589et contenant la sequence du gene N. 

[0276] De maniere plus precise : 

Cet ARN synthetique a ete prepare par transcription in vitro a I’aide de I’ARN polymerase du phage T7, d’une matrice 
d’ADN obtenu par linearisation du plasmide SRAS-N avec I’enzyme Bam HI. Apres elimination de la matrice d’ADN 
par digestion a I’aide de DNAse 1, les ARN synthetiques sont purifies par une extraction au phenol-chloroforme 
suivie de deux precipitations successives en acetate d’ammonium et isopropanol. Ils sont alors quantifies par mesure 
de I’absorbance a 260 nm et leur qualite est controlee par le rapport des absorbances a 260 et 280 nm ainsi que 
par une electrophorese en gel d’agarose. Ainsi, la concentration de la preparation d’ARN synthetique utilisee pour 
ces etudes est de 1,6 mg/ml, ce qui correspond a 2,1.10 15 copies/ml d’ARN. 

[0277] Des quantites decroissantes d’ARN synthetique ont ete amplifies par RT-PCR a I’aide du kit "Superscript™ 
One-Step RT-PCR with Platinum® Taq" et les couples d’amorces n° 1 (N/+/28507, N/-/28774) (figure 1 A) et n° 2 (N/+/ 
28375, N//28702) (figure IB), en suivant les indications du fournisseur. Les conditions d’amplification utilisees sont les 
suivantes : I’ADNca ete synthetise par incubation 30 min a 45 °C, 15 min a 55°C puis 2 min a 94 °C puis il a ete amplifie 
par 5 cycles comprenant: une etape de denaturation a 94°C pendant 15 sec, une etape d’hybridation a 45°C pendant 
30 sec puis une etape d’elongation a 72°C pendant 30 sec, suivis de 35 cycles comprenant: une etape de denaturation 
a 94°C pendant 15 sec, une etape d’hybridation a 55°C pendant 30 sec puis une etape d’elongation a 72°C pendant 30 
sec, avec 2 sec d’elongation supplemental a chaque cycle, et d’une etape finale d’elongation a 72°C pendant 5 min. 
Les produits d’amplification obtenus ont ensuite ete maintenus a 10°C. 

[0278] Les resultats presentes a la figure 11 montrent que le couple d’amorces n° 2 (N/+/28375, N/-/28702) permet 
de detecter jusqu’a 10 copies d’ARN (bande de faible intensite) ou 10 2 copies (bande de bonne intensite) contre 10 4 
copies pour le couple d’amorces n° 1 (N/+/28507, N/-/28774). Les amplicons sont respectivement de 268 pb (couple 1) 
et de 328 pb (couple 2). 
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c) mise au point de la RT-PCR en temps reel 

[0279] Une RT-PCR en temps reel a ete mise au point a I’aide du couple d'amorces n°2 et du couple de sonde constitue 
par SRAS/N/FL et SRAS/N/LC705 (figure 2). 

[0280] L’amplification a ete realisee sur un LightCycler™ (Roche) a I’aide du kit "Light Cycler RNA Amplification Kit 
Hybridization Probes " (reference 2 015 145, Roche) dans les conditions optimisees suivantes. Un Melange reactionnel 
contenant: H 2 0 (6,8 |xl), MgCI 2 25 mM (0,8 pul, 4 |xM final de Mg2+), melange reactionnel 5X (4 (xl), sonde SRAS/N/FL 
3 |xM (0,5 |xl, 0,075 ptM final), sonde SRAS/N/LC705 3 jjlM (0,5 pul, 0,075 puM final), amorce N/+/28375 10 |xM (1 pul, 0,5 
puM final), amorce N/-/28702 10 pM (1 pul, 0,5 |xM final), melange d'enzyme (0,4 pul) et echantillon (ARN viral, 5 pul) a ete 
amplifie en suivant le programme suivant: 

Transcription inverse : 50°C 10:00min analysis mode: none 
Denaturation : 95°C 30sec xl analysis mode: none 
Amplification : 95°C 2sec} 

50°C . 15sec analysis mode: quantification *} x45 
72°C 13sec rampe thermique 2,0°C/sec} 
refroidissement : 40°C 30sec xl analysis mode: none 

*La mesure de fluorescence se fait a la fin de I’hybridation et a chaque cycle (en mode SINGLE). 

[0281] Les resultats presentes a la figure 12 montrent que cette RT-PCR en temps reel est tres sensible puisqu’elle 
permet de detecter 10 2 copies d'ARN synthetique dans 100% des 5 echantillons analyses (29/29 echantillons dans 8 
experiences) et jusqu’a 10 copies d'ARN dans 100% des 5 echantillons analyses (40/45 echantillons dans 8 experiences). 
Elle montre egalement que cette RT-PCR permet de detecter la presence du genome du SARS-CoV dans un echantillon 
et de quantifier le nombre de genomes presents. A titre d’exemple, I’ARN viral d’un stock de SARS-CoV cultive sur 
cellules Vero E6 a ete extrait a I’aide du kit "Qiamp viral RNA extraction" (Qiagen), dilue a 0,05.10 -4 et analyse par RT- 
PCR en temps reel selon le protocole decrit ci-dessus; I’analyse presentee a la figure 12 montre que ce stock de virus 
contient 6,5.10 9 genomes -equivalents/ml (geq/ml), ce qui est tout a fait similairea la valeur de 1,0.10 10 geq/ml mesuree 
a I’aide du kit "RealArt™ HPA-Coronavirus LC RT PCR Reagents" commercialise par Artus. 

2) Mise au point de conditions de RT-PCR nichee ciblant le gene de I’ARN polymerase - test "RT-PCR nichee 
CDC (Centers for Disease Control and Prevention) /IP" 

a) Extraction de I’ARN viral 

[0282] Echantillon clinique : QIAamp viral RNA Mini Kit (QIAGEN) selon les indications du fabricant, ou une technique 
equivalents. L’ARN est elue dans un volume de 60 pul. 

b) RT-PCR nichee "SNE/SAR" 

Premiere etape : RT-PCR couplee « SNE » 

[0283] Le kit Invitrogen "Superscript™ One-Step RT-PCR with Platinum® Tacfa ete utilise, mais le kit "Titan" de 
Roche Boehringer peut lui etre substitue avec des resultats similaires. 

Oligonucleotides : 

[0284] 

- SNE-S1 5’ GGT TGG GAT TAT CCA AAA TGT GA 3’ 

- SNE-AS1 5'GCA TCA TCA GAA AGA ATC ATC ATG 3’ 

-> Taille attendue :440 pb 
1. Preparer un mix : 

H20 6,5 pul 

Reaction mix 2X 12,5 pul 

Oligo SNE-S1 50 |xM 0,2 pul 
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(suite) 

OligoSNE-ASI 50|jiM 0,2 jxl 
RNAsin 40 U/pl 0,12 pi 

RT/Platinum Taq mix 0, 5 |xl 

2. A 20 (jil du mix, ajouter 5 pi dARN et proceder a I’amplification sur thermocycleur (conditions ABI 9600): 


2.1 

45°C 

30 min. 



55°C 

15 min. 



94°C 

2 min. 


2.2. 

94°C 

15 sec. 

} 


45°C 

30 sec. 

} x 5 cycles 


72°C 

30 sec. 

} 

2.3. 

94°C 

15 sec. 

} 


55°C 

30 sec. 

}x 35 cycles 


72°C 

30 sec. + 2sec./cycle 

} 

2.4. 

72°C 

5 min. 


2.5 

10°C 

oo 



Conservation a +4°C. 

[0285] La RNAsin (N2511/N2515) de Promega a ete utilisee comme inhibiteurs de RNase. 

[0286] Des ARN synthetiques ont servi de temoin positif. A titre de controle, 10 3 , 10 2 et 10 copies d’ARN synthetique 
R sne ont ete amplifies dans chaque experience. 

Seconde etape : PCR nichee "SAR" 

Oligonucleotides : 

[0287] 

- SAR1-S 5’ CCT CTC TTG TTC TTG CTC GCA 3’ 

- SARI -AS 5’ TAT AGT GAG CCG CCA CAC ATG 3’ 

-> Taille attendue : 121 pb 
1. Preparer un mix : 

H20 

Tampon Taq 10X 
MgCI 2 25 mM 
Mix dNTPs 5 mM 
Oligo SAR1-S 50 pM 
Oligo SARI-AS 50 pM 
Taq ADN pol 5 U/pl 


35,8 pi 
5 pi 
4 pi 
2 pi 
0,5 pi 
0,5 pi 
0,25 pi 


L'AmpliTaq DNA Pol d’Applied Biosystems a ete utilisee (tampon 10X sans MgCI 2 , ref 27216601). 

2. A 48 pi du mix, ajouter 2 pi du produit de la premiere PCR et proceder a I’amplification (conditions ABI 9600) : 


2.1. 

94°C 

2 min. 


2.2. 

94°C 

30 sec. 

} 


45°C 

45 sec. 

} x 5 cycles 


72°C 

30 sec. 

} 

2.3. 

94°C 

30 sec. 

} 


55°C 

30 sec. 

}x 35 cycles 
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(suite) 


72°C 

30 sec. + Isec./cycle 

2.4. 

72°C 

5 min. 

2.5 

10°C 

oo 


3. Analyser 10 |xl du produit reactionnel sur gel "low-melting (type Seakem GTG) a 3% d’agarose. 

La sensibilite du test niche est en routine, dans les conditions decrites, de 10 copies d’ARN. 

4. Les fragments peuvent ensuite etre purifies sur QIAquick PCR kilt (QIAGEN) et sequences avec les oligos SAR1-S 
et SARI-AS. 

3) Detection de I’ARN du SARS-CoV par PCR a partir de prelevements respiratoires 

a) Premiere etude comparative 

[0288] Une etude comparative a ete realisee sur une serie de prelevements respiratoires regus par le Centre National 
de Reference du Virus Influenzae (region nord) et susceptibles de contenir du SARS-CoV. Pour ce faire, IARN a ete 
extrait des prelevements a I'aide du kit "Qiamp viral RNA extraction" (Qiagen) et analyse par RT-PCR en temps reel, 
d’une part a I’aide des couples d’amorces et de sondes de la serie n° 2 dans les conditions decrites ci-dessus d’une 
part, et d’autre part a I'aide du kit "LightCycler SARS-CoV quantification kit" commercialise par Roche (reference 03 604 
438). Les resultats sont resumes dans le Tableau VI ci-dessous. Ms montrent que 18 des 26 prelevements sont negatifs 
et 5 des 26 prelevements sont positifs pour les deux kits, tandis qu’un prelevement est positif pour le seul kit Roche et 
deux pour les seuls reactifs N "serie2". En outre, pour 3 prelevements (20032701,20032712, 20032714) les quantites 
d'ARN detectes sontnettementsuperieures avec les reactifs (sondes et amorces) de la serie n°2. Ces resultats indiquent 
que les amorces et sondes N "serie2" sont plus sensibles pour la detection du genome du SARS-CoV dans des prele¬ 
vements biologiques que celles du kit actuellement disponible. 

Tableau VI: Analyse par RT-PCR en temps reel des ARN extraits d’une serie de prelevements de 5 patients 
a I’aide des couples d’amorces et de sondes de la serie n° 2 (N "serie 2") ou du kit "LightCycler SARS-CoV 
quantification kit" (Roche). Le type de prelevement est indique ainsi que le nombre de copies de genome 
viral mesurees dans chacun des deux tests. NEG : RT-PCR negative. 


Prelevements n° 

Patient 

Type de 
prelevement 

KIT ROCHE 

N "serie2" 

20033082 

K 

nasal 

NEG 

NEG 

20033083 

K 

pharynge 

NEG 

NEG 

20033086 

K 

nasal 

NEG 

NEG 

20033087 

K 

pharynge 

NEG 

NEG 

20032802 

M 

nasal 

NEG 

NEG 

20032803 

M 

expectoration 

NEG 

NEG 

20032806 

M 

nasal ou pharynge 

NEG 

NEG 

20031746ARN2 

C 

pharynge 

NEG 

NEG 

20032711 

C 

nasal ou pharynge 

39 

NEG 

20032910 

B 

nasal 

NEG 

NEG 

20032911 

B 

pharynge 

NEG 

NEG 

20033356 

V 

expectoration 

NEG 

NEG 

20033357 

V 

expectoration 

NEG 

NEG 

20031725 

K 

asp. endotracheale 

NEG 

150 

20032657 

K 

asp. endotracheale 

NEG 

NEG 

20032698 

K 

asp. endotracheale 

NEG 

NEG 

20032720 

K 

asp. endotracheale 

3 

5 

20033074 

K 

selles 

115 

257 

20032701 

M 

pharynge 

443 

1676 

20032702 

M 

expectoration 

NEG 

249 

20031747ARN2 

C 

pharynge 

NEG 

NEG 
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(suite) 


Prelevements n° 

Patient 

Type de 
prelevement 

KIT ROCHE 

N "serie2" 

20032712 

C 

inconnu 

634 

6914 

20032714 

C 

pharynge 

17 

223 

20032800 

B 

nasal 

NEG 

NEG 

20033353 

V 

nasal 

NEG 

NEG 

20033384 

V 

nasal 

NEG 

NEG 


b) Deuxieme etude comparative 

[0289] Les performances de differentes methodes de RT-PCR nichee et de RT-PCR en temps reel ont ensuite ete 
comparees pour 121 prelevements respiratoires de cas possibles de SRAS de I’hopital frangais de Hanoi, Vietnam, 
realises entre le 4® me et le 17® me jour apres le debut des symptomes. Parmi ces prelevements, 14 avaient ete trouves 
positifs lors d’un premier test utilisant la methode de RT-PCR nichee ciblant I'ORFIb (codant pour la replicase) telle que 
decrite initialement par le Bernhard Nocht Institute (RT-PCR nichee BNI). Des informations concernant ce test sont 
disponibles sur internet, a I’adresse http://wwwl5.bni-hamburg.de/bnilbn12/neu2/getfile.acgi7area_engNdiagnos- 
tics&pid=4112. 

[0290] Les differents tests compares dans cette etude sont: 

la methode de RT-PCR guantitative selon I’invention, avec les amorces et sonde N "serie 2" decrite ci-dessus 
(colonne Light Cycler N), 

le test de RT-PCR nichee ciblant le gene de I’ARN polymerase decrit ci-dessus, developpe par le CDC, le BNI et 
I’lnstitut Pasteur (RT-PCR nichee CDC/IP), 

le kit ARTUS de reference "HPA Corona LC RT-PCR Kit # 5601-02", qui est un test de RT-PCR en temps reel 
ciblant le gene ORFIb, 

le test de RT-PCR nichee du BNI, ciblant egalement le gene de IARN polymerase, mentionne ci-dessus. 

[0291] Les inventeurs ont constate : 

1) une variability inter-test pour une meme technique, liee a la degradation de la preparation dARN lors de decon¬ 
gelations repetees, notamment pour les echantillons contenant les quantites dARN les plus faibles, 

2) une sensibilite reduite de la RT-PCR nichee CDC/IP par rapport a la RT-PCR nichee BNI, et 

3) une sensibility comparable du test de RT-PCR quantitative selon I'invention (Light Cycler N) par rapport au test 
Light Cycler (LC) Artus. 

[0292] Ces resultats, presentes dans le Tableau VII ci-dessous, montrent que le test par RT-PCR quantitative selon 
I’invention constitue un excellent complement - ou une alternative - aux tests actuellement disponibles. En effet, le 
coronavirus lie au SRAS est un virus emergent, susceptible d’evoluer rapidement. En particulier, le gene de la RNA 
polymerase du coronavirus lie au SRAS, qui est cible dans la plupart des tests actuellement disponibles, peut recombiner 
avec celui d’autres coronavirus non lies au SRAS. L’utilisation d’un test ciblant exclusivement ce gene pourrait alors 
conduire a I’obtention de faux negatifs. 

[0293] Le test par RT-PCR quantitative selon I’invention ne cible pas la meme region genomique que le kit ARTUS, 
puisqu’il cible le gene codant pour la proteine N. En realisant un test de diagnostique ciblant deux genes differents du 
coronavirus lie au SRAS, on peut done esperer s’affranchir de resultats de type faux negatifs, qui pourraient etre dus a 
revolution genetique du virus. 

[0294] De plus, il apparaTt particulierement avantageux de cibler le gene de la proteine de nucleocapside, car il est 
tres stable, du fait de la forte pression de selection liee aux contraintes structurales elevees concernant cette proteine. 
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Tableau VII: Comparaison de differentes methodes d’analyse par amplification genique, a partir de 121 
Prelevements de cas probables de SRAS de I’hopital frangais de Hanoi, Vietnam (epidemie 2003) 


N° CNR 

Type 

prelevement 

(1) 

Jour 

prelevement 

Patient 

RT-PCR 

nichee 

CDC/IP 

RT-PCR 

nichee 

BNI 

kit Light 
Cycler 
Artus 

Light 
Cycler N 
(IP) 

107 

prelevements 

N et P 



Negatif 

Negatif 

Negatif 

Negatif 

032529 

P 

10 

NHB 

Negatif 

Positif 

Negatif 

Negatif 

032530 

N 

10 

NHB 

Positif 

Positif 

3.10E+01 

4,20E+01 

032531 

P 

7 

LP 

Positif 

Positif 

7,70E+00 

3,10E+00 

032534 

N 

15 

BND 

Positif 

Positif 

1.60E+00 

Negatif 

032600 

P 

4 

NHH 

Negatif 

Positif 

Negatif 

1.30E+02 

032612 

P 

17 

NTS 

Negatif 

Positif 

Negatif 

Negatif 

032688 

P 

9 

BTX 

Positif 

Positif 

Negatif 

Negatif 

032689 

N 

4 

NVH 

Positif 

Positif 

1.20E+01 

2,30E+02 

032690 

P 

4 

NVH 

Negatif 

Positif 

1.60E+00 

Negatif 

032727 

P 

8 

NVH 

Positif 

Positif 

2.30E+02 

4.00E+02 

032728 

N 

8 

NVH 

Positif 

Positif 

1.10E+03 

1.60E+04 

032729 

P 

14 

NHB 

Positif 

Positif 

5,90E+00 

3,40E+01 

032730 

N 

14 

NHB 

Positif 

Positif 

1.30E+02 

4,80E+02 

032741 

P 

8 

NHH 

Positif 

Positif 

2,10E+02 

1.30E+02 


positifs 

10 

14 

10 

9 

fraction detectee des 14 positifs 

71,4% 

100,0% 

71,4% 

64,3% 

(1) P= ecouvillonage pharynge 

N= ecouvillonage nasal 


Exemple 9 : Obtention et caracterisation d’anticorps monoclonaux diriges contre la proteine N 

[0295] Des souris Balb C ont ete immunisees a I’aide de la proteine N recombinante purifiee et leurs cellules spleniques 
fusionnees avec un myelome murin approprie selon les techniques de Kohler et Milstein. 

[0296] Dix-neuf hybridomes secreteurs d’anticorps anti N ont ete preselectionnes et leurs immuno reactivites precisees. 
Ces anticorps reconnaissent bien la proteine N recombinante (en ELISA) avec des intensites variables, ainsi que la 
proteine virale, naturelle N en ELISA et/ou en Western Blot. Les figures 18 a 20 montrent les resultats de ces tests pour 
15 de ces 19 anticorps monoclonaux. 

[0297] Les clones 12, 17, 28, 57, 72, 76, 86, 87, 98, 103, 146, 156, 166, 170, 199, 212, 218, 219 et 222, fortement 
reactifs, ont ete sous clones. Les etudes de specificite ont ete poursuivies avec les outils appropries afin de preciser les 
epitopes reconnus et verifier I’absence de reactivite vis-a-vis des autres Coronavirus humains et de certains virus 
respiratoires. 

[0298] Les etudes de cartographie ( mapping ) epitopique (realisees sur membrane spot, a I'aide de peptides chevau- 
chants de 15 aa) et les etudes supplementaires realisees sur la proteine N naturelle en Western Blot ont revele I’existence 
de 4 groupes d’anticorps monoclonaux : 

1 ° Anticorps monoclonaux specifiques d’un epitope lineaire majeur en position N-ter (75-81, sequence : INTNSVP) 
Le representant de ce groupe est I’anticorps 156. L’hybridome produisant cet anticorps a ete depose a la Collection 
Nationale de Cultures de Microorganismes (CNCM) de I’lnstitut Patseur (Paris, France) le 1 er decembre 2004, sous 
le numero 1-3331. Ce meme epitope est egalement reconnu par un serum de lapin (polyclonal anti N) obtenu par 
immunisation classique a I’aide de cette meme proteine N. 
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2° Anticorps monoclonaux specifiques d’un epitope lineaire majeur situe en position centrale (position 217-224, 
sequence : ETALALL); les representants de ce groupe sont les anticorps monoclonaux 87 et 166. L’hybridome 
produisant I’anticorps 87 a ete depose a la CNCM le 1 er decembre 2004, sous le numero 1-3328. 

3° Anticorps monoclonaux specifiques d'un epitope lineaire majeur situe en position C-terminale (position 403-408, 
sequence : DFFRQL), les representants de ce groupe sont les anticorps 28, 57 et 143. L’hybridome produisant 
I’anticorps 57 a ete depose a la CNCM le 1 er decembre 2004, sous le numero 1-3330. 

4° Anticorps monoclonaux specifiques d’un epitope discontinu, conformationel. Ce groupe d’anticorps ne reconnaTt 
aucun des peptides recouvrant la sequence de la proteine N, mais reagissent fortement sur la proteine naturelle 
non denaturee. Le representant de ce dernier groupe est I’anticorps 86. L’hybridome produisant cet anticorps a ete 
depose a la CNCM le 1 er decembre 2004, sous le numero 1-3329. 

[0299] Le Tableau VIII ci-apres resume les resultats de cartographie epitopique obtenus : 


Tableau VIII : Mapping epitopique des anticorps monoclonaux 


Anticorps 

Epitope 

Position 

Region 

28 

DFSRQL Q 

403 ... 408 

C-Ter. 

143 

DFSRQL Q 



76 

DFSRQL Q 


57 

DFSRQL Q 



FFGMS Rl 

315 .... 319 

146 

LPQRQ 

383...387 

166 

ETALALL LL 

217 ...224 

centrale 

87 

ETALALL 

217... 224 

156 

INTNSGP 

75... 81 

N - Ter. 

86 

Conformationnel 



212 

Conformationel 



170 

Conformationnel 




[0300] En outre, comme illustre notamment aux figures 18 et 19, ces anticorps ne presentent pas de reactivite en 
ELISA et/ou en WB, vis a vis de la proteine N du coronavirus humain 229 E. 

Exemple 10 : Combinaisons des anticorps monoclonaux pour le developpement d’un test d’immunocapture 
sensible et specifique de I’antigene viral N dans le serum ou les fluides biologiques des patients contamines 
par le virus SARS Co V 

[0301] Les anticorps listes ci-dessous ont ete retenus en raison de leurs proprietes bien particulieres pour une etude 
supplementaire de capture et detection de la proteine virale N, dans le serum des sujets ou patients. 

[0302] Ces anticorps ont ete produits en ascite sur souris, purifies par chromatographie d’affinite et utilises seuls ou 
en combinaison comme anticorps de capture, et comme anticorps signal. 

[0303] Liste des anticorps selectionnes pour le propos : 

Acm anti region C-ter (n° 28, 57, 143) 

Acm anti region centrale (n° 87, 166) 

Acm anti region N-ter (n° 156) 

Acm anti epitope discontinu, conformationnel (86) 

1) Preparation des reactifs : 

a) Plaques ELISA immunocapture 

[0304] Les plaques sont sensibilisees avec les solutions d’anticorps a 5 |a,g/ml en tampon carbonate 0,1 M, pH.9,6. 
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Les solutions (monovalentes ou plurivalentes) sont deposees sous volume de 100 |xl dans les puits et incubees pendant 
une nuit a temperature ambiante. Ces plaques sont ensuite lavees en tampon PBS (10 mM pH 7,4 additionne de 0,1% 
de Tween 20) puis saturees avec une solution de PBS additionnee de 0,3% de BSA et de 5% de Saccharose). Les 
plaques sont ensuite sechees puis conditionnees dans un sachet en presence d’un dessicant. Elies sont pretes a I'emploi. 

b) Conjugues 

[0305] Les anticorps purifies ont ete couples a la peroxydase selon le protocole de Nakane (Nakane et al. -1974, J.of 
Histo and cytochemistry, vol.22, pi084-1091) dans un rapport de une molecule d’lgG pour 3 molecules de peroxydase. 
Ces conjugues ont ete purifies parchromatographie d'exclusion et conserves concentres (concentration comprise entre 
1 a 2 mg/ml) en presence de 50% de glycerol et a -20°C. Ils sont dilues pour leur mise en oeuvre dans les essais a la 
concentration finale de 1 ou 2 p,g/ml en tampon PBS (pH 7,4) additionne de 1% de BSA. 

c) Autres reactifs 

[0306] 

Serums humains negatifs pour tous les marqueurs seriques des virus HIV, HBV, HCV et THLV 
Pool de serums humains negatifs additionne de 0,5% de Triton X 100 

Ag viral inactive : surnageant de culture virale inactive par irradiation et inactivation verifiee apres mise en culture 
sur cellules sensibles - titre de la suspension avant inactivation environ 10 * 2 3 * * * 7 * particules infectieuses par ml ou encore 
environ 5x10 9 particules virales physiques par ml d’antigene 

Les echantillons d’Ag dilues en serum humain negatif: ces echantillons ont ete prepares par dilution au 1:100 e puis 
par dilution en serie de raison 5. 

Ces echantillons non infectieux miment des echantillons humains supposes contenir des concentrations faibles a 
tres faibles de nucleoproteine virale N. De tels echantillons ne sont pas accessibles pour les travaux de routine 
Solution de lavage R2, solution de revelation TMB R8, chromogene R9 et solution d’arret R10, sont les reactifs 
generiques commercialises par Bio-Rad dans ses trousses ELISA (ex : trousse Platelia Pylori ref.72778). 

2) Mode operatoire 

[0307] Les echantillons de serums humains surcharges en Ag viral inactive sont distribues a raison de 100 |xl par 
cupule, directement dans les plaques sensibilisees, pretes a I’emploi puis incubes pendant 1 heure a 37°C (incubation 
Bio-Rad IPS). 

[0308] Le materiel non retenu par la phase solide est elimine par 3 lavages (lavage avec solution R2 diluee, laveur 
automatique LP 35). 

[0309] Les conjugues appropries, dilues a la concentration finale de 1 ou 2 |a,g/ml sont distribues a raison de 100 |xl 
par cupule et les plaques incubees a nouveau pendant une heure a 37° C (incubation IPS). 

[0310] L’exces de conjugue est elimine par 4 lavages successifs (solution R2 diluee - laveur LP 35). 

[0311] La presence de conjugue fixe sur les plaques est revelee apres addition de 100 |xl de solution de revelation 
preparee avant emploi (1 ml de R9 et 10 ml de R8) et apres incubation pendant 30 minutes, a temperature ambiante et 
a I'abri de la lumiere. 

[0312] La reaction enzymatique estfinalement bloquee par addition de 100 p.1 de reactif R10 (H2S04 IN) dans toutes 
les cupules. 

[0313] La lecture est effectuee a I’aide d’un lecteurde microplaque approprie a double longueur d’onde (450/620 nm). 
[0314] Les resultats peuvent etre interpreter en utilisant comme valeur seuil provisoire la moyenne d’au moins deux 
controles negatifs multiplie par un facteur 2 ou encore la moyenne de 100 serums negatifs additionnee d’un increment 
correspondant a 6 SD (Standart Deviation calculee sur les 100 mesures individuelles). 

3) Resultats 

[031 5] Differentes combinaisons anticorps de capture et anticorps signal ont ete testees en se fondant sur les proprietes 

des anticorps selectionnes, et en evitant les combinaisons d’anticorps specifiques des memes epitopes en phase solide 

et en conjugues. 

[031 6] Les meilleurs resultats ont ete obtenus avec les 4 combinaisons listees ci-dessous. Ces resultats sont reproduits 

dans le tableau IX ci-apres. 

1. Combinaison F/28 


49 




5 

10 

15 

20 

25 

30 

35 

40 

45 

50 

55 


EP 1 694 829 B1 


Phase solide (Acm 166 + 87 region centrale): conjugue anticorps 28 (C-ter) 

2. Combinaison G/28 

Phase solide (Acm 86 - epitope conformationel): conjugue anticorps 28 (C-ter) 

3. Combinaison H/28 

Phase solide (Acms 86, 166 et 87 region centrale et epitope conformationel): conjugue anticorps 28 (C-ter) 

4. Combinaison H/28 + 87 

Phase solide (Acms 86, 166 et 87 region centrale et epitope conformationel): conjugue mixte anticorps 28 (C-ter) 
et 87 (central) 

5. Combinaison G/87 

Phase solide (Acm 86 - epitope conformationel): conjugue anticorps 87 (region centrale) 

Les 4 premieres combinaisons presentent des performances equivalentes et reproduites, superieures aux autres 
combinaisons mises en oeuvre (comme par exemple la combinaison G/87). Bien entendu, dans ces combinaisons, 
un anticorps monoclonal peut etre remplace par un autre anticorps reconnaissant le meme epitope. Ainsi, on peut 
citer les variantes suivantes : 

6. Variante de la combinaison F/28 

Phase solide (Acm 87 uniquement): conjugue anticorps 57 (C-ter) 

7. Variante de la combinaison G/28 

Phase solide (Acm 86 - epitope conformationel): conjugue anticorps 57 (C-ter) 

8. Variante de la combinaison H/28 

Phase solide (Acms 86 et 87 region centrale et epitope conformationel) : conjugue anticorps 57 (C-ter) 

9. Variante de la combinaison H/28 + 87 

Phase solide (Acms 86 et 87 region centrale et epitope conformationel): conjugue mixte anticorps 57 (C-ter) et 87 
(central) 


Tableau IX : Controle d'immunoreactivite des Acm anti nucleoproteines SARS CoV : densites optiques mesurees 
avec chaque combinaison d’anticorps, en fonction des dilutions de I’antigene viral inactive. 


N° 

Dilution 

F/28 

G/28 

G/87 

H/28 

H/28+87 

0 

1/100 

5 

5 

3,495 

3,900 

5 

1 

1/500 

3, 795 

3,814 

1,379 

3,702 

3,804 

2 

Vz 500 

2,815 

2,950 

0,275 

3,268 

2,680 

3 

1/12500 

0,987 

1,038 

0,135 

1,374 

0,865 

4 

1/62500 

0,404 

0,348 

0,125 

0,480 

0,328 

5 

1/312500 

0,285 

0,211 

0,123 

0,240 

0,215 

6 

Temoin 

0,210 

0,200 

0,098 

0,186 

0,156 

7 

Temoin 

0,269 

0,153 

0,104 

0,193 

0,202 


[0317] La limite de detection de ces 4 essais experimentaux correspond a la dilution d’antigene en serum negatif 1: 
62500. Une extrapolation rapide laisse supposer la detection de moins de 10 3 particules infectieuses par ml de serums. 
[0318] De cette etude, il ressort que les anticorps les mieux appropries pour la capture de la nucleoproteine virale 
native sont les anticorps specifiques de la region centrale et/ou d’un epitope conformationnel, I’un et I’autre etant des 
anticorps selectionnes egalement pour leur forte affinite pour I’antigene natif. 

[0319] Ayant determine les meilleurs anticorps pour la composition de la phase solide, les anticorps a retenir en priorite 
pour la detection des antigenes fixes sur la phase solide, sont les anticorps complementaires specifiques d’un epitope 
dominant en region C-ter. L'emploi de tout autre anticorps complementaire, mais specifique des epitopes localises en 
region N-ter de la proteine conduit a des resultats moyens ou mediocres. 

Exemple 11 : Systemes d’expression eucaryotes de la proteine de spicule (S) du coronavirus associe au SRAS 
(SRAS-CoV) 

1) Optimisation des conditions d’expression de la S du SRAS-CoV en cellules de mammiferes. 

[0320] Les conditions d’expression transitoire de la proteine de spicule (S) du SRAS-CoV ont ete optimisees en cellules 
de mammiferes (293T, VeroE6). 

[0321] Pour cela, un fragment d’ADN contenant le cDNA de la S du SRAS-CoV a ete amplifie par PCR a I'aide des 
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oligonucleotides 5’-ATAGGATCCA CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3’ et 5’-ATACTCGAGTT AT- 
GTGTAATG TAATTTGACA CCCTTG-3’ a partir du plasmide pSARS-S (C.N.C.M. n° 1-3059) puis insere entre les sites 
BamHI etXhol du plasmide pTRIPAU3-CMV contenant un vecteur lentiviral TRIP (Sirven, 2001, Mol. Ther., 3,438-448) 
pour obtenir le plasmide pTRIP-S. Le fragment BamHI et Xhol contenant le cDNA de la S a ensuite ete sous-clone 
entre les BamHI etXhol du plasmide d’expression eucaryote pcDNA3.1(+) (Clontech) pour obtenir le plasmide pcDNA- 
S. Le fragment Nhel et Xhol contenant le cADN de la S a ensuite ete sous-clone entre les sites correspondants du 
plasmide d’expression pCI (Promega) pour obtenir le plasmide pCI-S. Les sequences WPRE du virus de I’hepatite de 
la marmotte (" Woodchuck Hepatitis Virus posttranscriptional regulatory element') et les sequences CTE ("constitutive 
transport element') du retrovirus simien de Mason-Pfizer ont ete inserees dans chacun des deux plasmides pcDNA-S 
et pCI-S entre les sites Xhol et Xbal pour obtenir respectivement les plasmides pcDNA-S-CTE, pcDNA-S-WPRE, pCI- 
S-CTE et pCI-S-WPRE (figure 21). Le plasmide pCI-S-WPRE a ete depose a la CNCM, le 22 novembre 2004, sous le 
numero 1-3323. Tous les inserts ont ete sequences a I’aide d’un kit BigDye Terminator vl.1 (Applied Biosystems) et 
d’un sequenceur automatique ABI377. 

[ 0322 ] La capacity des plasmides construits a diriger I'expression de la S du SRAS-CoV dans des cellules de mam- 
miferes a ete recherchee apres transfection de cellules VeroE6 (figure 22). Dans cette experience, des monocouches 
de 5x10 5 cellules VeroE6 en boites de Petri de 35mm ont ete transferees avec 2 p,g des plasmides pcDNA (a titre de 
controle), pcDNA-S, pCI et pCI-S et 6 |xl de reactif Fugene6 selon les indications du fabricant (Roche). Apres 48 heures 
d’incubation a 37°C et sous 5% de C0 2 , des extraits cellulaires ont ete prepare en tampon de depot selon Laemmli, 
separes sur un gel SDS a 8% de polyacrylamide, puis transferes sur une membrane de PVDF (BioRad). La detection 
de cette immunoempreinte (« western blot ») a ete realisee a I’aide d’un serum polyclonal de lapin anti-S (immun-serum 
du lapin P11135 : cf exemple 4 ci-dessus) et d'anticorps polyclonaux d’ane diriges contre les IgG de lapin et couples a 
la peroxidase (NA934V, Amersham). Les anticorps fixes ont ete reveles par luminescence a I’aide du kit ECL+ (Amers- 
ham) et de films d’autoradiographie Hyperfilm MP (Amersham). 

[ 0323 ] Cette experience (figure 22) montre que le plasmide pcDNA-S ne permet pas de diriger I’expression de la S 
du SRAS-CoV a des niveaux detectables tandis que le plasmide pCI-S permet une expression faible, proche de la limite 
de detection, qui peut etre mise en evidence lorsque le film est surexpose. Des resultats similaires ont ete obtenus 
lorsque I’expression de la S a ete recherchee par immunofluorescence (donnees non montrees). Cette impossibility de 
detecter une expression efficace de la S ne peut pas etre imputee aux techniques de detection utilisees puisque la 
proteine S peut etre mise en evidence a la taille attendue (180 kDa) dans un extrait de cellules infectees par le SRAS- 
CoV ou dans un extrait de cellules VeroE6 infectees par le virus recombinant de la vaccine VV-TF7.3 et transferees 
par le plasmide pcDNA-S. Dans cette derniere experience, le virus VV-TF7.3 exprime I’ARN polymerase du phage T7 
et permet la transcription cytoplasmique d’un ARN non coiffe susceptible d’etre traduit efficacement. Cette experience 
suggere que les defauts d’expression decrits ci-dessus sont dus a une incapacity intrinseque du cADN de la S a etre 
exprime efficacement lorsque I’etape de transcription en ARN messager est realisee au niveau nucleaire. 

[ 0324 ] Dans une seconde experience, I’effet des signaux CTE et WPRE sur I'expression de la S a ete recherchee 
apres transfection de cellules VeroE6 (figure 23A) et 293T (figure 23B) et selon un protocole similaire a celui decrit ci- 
dessus. Alors que I’expression de la S ne peut pas etre mis en evidence apres transfection des plasmides pcDNA-S- 
CTE et pcDNA-S-WPRE derives de pcDNA-S, I’insertion des signaux WPRE et CTE ameliore fortement I’expression 
de la S dans le contexte du plasmide d’expression pCI-S. 

[ 0325 ] Pour preciser ce resultat, une deuxieme serie d'experiences a ete realisee, ou I’immunoempreinte est revelee 
defagon quantitative par luminescence et acquisition sur un dispositif d’imagerie numerique (FluorS, BioRad). L’analyse 
des resultats obtenus avec le logiciel QuantityOne v4.2.3 (BioRad) montre que les sequences WPRE et CTE augmentent 
respectivement I’expression de la S d'un facteur 20 a 42 et 10 a 26 en cellules Vero E6 (Tableau X). En cellules 293T 
(Tableau X), I’effet de la sequence CTE est plus modere (4 a 5 fois) tandis que celui de la sequence WPRE reste 
important (13 a 28 fois). 
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Tableau X analyse quantitative de I’effet des signaux CTE et WPRE sur I’expression de la S du SRAS-CoV : 

Des extraits cellulaires ont ttt prepares 48 heures apres transfection de cellulesVeroE6 ou 293T par les plasmides 
pCI, pCI-S, pCI-S-CTE et pCI-S-WPRE et analyses par western blot comme decrit dans la legende de la figure 22. 
Le western blot est rtvtlt par luminescence (ECL+, Amersham) et acquisition sur un dispositif d’imagerie numerique 
(FluorS, BioRad). Les niveaux d’expression sont indiques en fonction d’une tchelle arbitraire ou la valeur de 1 
represente le niveau mesure apres transfection du plasmide pCI-S. Deux experiences independantes ont ete realisees 
pour chacun des deux types cellulaires. Dans I’experience 1 sur cellules VeroE6, les transfections ont ete realisees 
en dupliques et les resultats sont indiques sous la forme de moyennes et ecart-types des niveaux d’expression 

mesures. 


Plasmide 

Cellule 

exp. 1 

exp. 2 

PCI 

VeroE6 

0,0 

0,0 

pCI-S 

VeroE6 

1,0 ± 0,1 

1,0 

pCI-S-CTE 

VeroE6 

9,8 ± 0,9 

26,4 

pCI-S-WPRE 

VeroE6 

20,1 ± 2,0 

42,3 

PCI 

293T 

0,0 

0,0 

PCI-S 

293T 

1,0 

1,0 

PCI-S-CTE 

293T 

4,6 

4,0 

PCI-S-WPRE 

293T 

27,6 

12,8 


[0326] En resume, I’ensemble de ces resultats montre que I’expression dans des cellules de mammiferes du cADN 
de la S du SRAS-CoV sous la dependance de sequences promotrices de I'ARN polymerase II, requiert, pour etre efficace, 
la presence d’un signal d’epissage ainsi que de I’une ou I’autre des sequences WPRE et CTE. 

2) Obtention de lignees stables permettant I’expression de la S du SRAS-CoV 

[0327] Le cADN de la proteine S du SRAS-CoV a ete clone sous la forme d’un fragment BamHI -Xhol dans le plasmide 
pTRIPAU3-CMV contenant un vecteur lentiviral defectif TRIP a DNA flap central (Sirven et al, 2001, Mol. Ther., 3 : 
438-448) pour obtenir le plasmide pTRIP-S (figure 24). La co-transfection transitoire selon Zennou et al (2000, Cell, 
101 : 173-185) de ce plasmide, d’un plasmide d’encapsidation (p8.2) et d’un plasmide d’expression de la glycoproteine 
d’enveloppe G du VSV (pHCMV-G) dans des cellules 293T a permis la preparation de pseudoparticules retrovirales 
contenant le vecteur TRIP -S et pseudotypees par la proteine d’enveloppe G. Ces vecteurs TRIP-S pseudotypes ont 
ete utilises pourtransduire des cellules 293T et FRhK-4 : aucune expression de la proteine S n'a pu etre mis en evidence 
par western blot et immunofluorescence dans les cellules transduites (donnees non presentees). 

[0328] Les cassettes d’expression optimales constitutes du promoteur immediat/precoce du virus CMV, d’un signal 
d’epissage, du cDNA de la S et de I’un ou I’autre des signaux post-transcriptionnels WPRE ou CTE decrites ci-dessus 
ont alors ete substitutes a la cassette EFIa-EGFP du vecteur d’expression lentiviral dtfectif a DNA FLAP central 
TRIPAU3-EF1a (Sirven et al, 2001, Mol. Ther., 3 :438-448) (figure 25). Ces substitutions ont ttt rtalistes par une strie 
de sous-clonages successifs des cassettes d’expression de S qui ont ttt excistes des plasmides pCT-S-CTE (Bglll- 
Apal) ou respectivement pCI-S-WPRE (Bglll-Sall) puis instrtes entre les sites Mlul et Kpnl ou respectivement Mlul 
et Xhol du plasmide TRIPAU3-EF1a pour obtenir les plasmides pTRIP-SD/SA-S-CTE et pTRIP-SD/SA-S-WPRE, dt- 
posts a la CNCM, le 1 er dtcembre2004, sous les numtros 1-3336 et 1-3334, respectivement. Des vecteurs pseudotypts 
ont ttt produits selon Zennou et al (2000, Cell, 101 : 173-185) et utilists pour transduire des cellules 293T (10000 
cellules) et FRhK-4 (15000 cellules) selon une strie de 5 cycles successifs de transduction avec une quantitt de vecteur 
correspondant a 25 ng (TRIP-SD/SA-S-CTE) ou 22 ng TRIP-SD/SA-S-WPRE) de p24 par cycle. 

[0329] Les cellules transduites ont ttt clontes par dilution limite et une strie de clones ont ttt analysts pour I’ex¬ 
pression de la S du SRAS-CoV qualitativement par immunofluorescence (donntes non montrtes), puis quantitativement 
par western blot (figure 25) a I’aide d’un strum polyclonal de lapin anti-S. Les rtsultats prtsentts dans la figure 25 
montrent que les clones 2 et 15 de cellules FrhK4-s-CTE transduites par TRIP-SD/SA-S-CTE et les clones 4, 9 et 12 
de cellules FRhK4-S-WPRE transduites par TRIP-SD/SA-S-WPRE permettent I’expression de la S du SRAS-CoV a 
des niveaux respectivement faibles et modtrts si on les compare a ceux que I’on peut observer au cours de I’infection 
par le SRAS-CoV. 

[0330] En rtsumt, les vecteurs TRIP-SD/SA-S-CTE et TRIP-SD/SA-S-WPRE permettent I’obtentionde clones stables 
de cellules FRhK-4 et de fagon similaire 293T exprimant la S du SRAS-CoV, alors que les essais realists avec le vecteur 
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"de base" TRIP-S sont restes infructueux, ce qui demontre la necessity d’un signal d’epissage ainsi que de I’une, ou 
I’autre, des sequences CTE et WPRE pour I’obtention de clones cellulaires stables exprimant la proteine S. 

[0331] En outre, ces modifications du vecteur TRIP (insertion d’un signal d’epissage et d’un signal post-transcriptionnel 
comme CTE et WPRE) pourraient s’averer interessantes pour ameliorer I’expression d'autres cDNA que celui de la S. 

3) Obtention de lignees stables permettant I'expression d’une forme soluble de la S du SRAS-CoV. Purification de cet 
antigene recombinant 

[0332] Un cDNA codant pour une forme soluble de la proteine S (Ssol) a ete obtenu en fusionnant les sequences 
codant pour I’ectodomaine de la proteine (acides amines 1 a 1193) a celles d’une etiquette (FLAG : DYKDDDDK) via 
un linker BspEI codant pour le dipeptide SG. Pratiquement, pour obtenir le plasmide pcDNA-Ssol, un fragment d’ADN 
codant pour I’ectodomaine de la S du SRAS-CoV a ete amplifie par PCR a I’aide des oligonucleotides 5’-ATAGGATCCA 
CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3’ et 5’-ACCTCCGGAT TTAATATATT GCTCATATTT TCCCAA- 
3’ a partirdu plasmide pcDNA-S, puis insere entre les sites uniques BamHI et BspEI uniques d’un plasmide d’expression 
eucaryote pcDNA3.1(+) (Clontech) modifie contenant entre ses sites BamHI et Xhol la sequence de I’etiquette FLAG : 


// GGATCC ...nnn... TCC GGA GAT TAT AAA GAT GAC GAC GAT AAA TAA 
BamHI SGDYKDDDDK ter 

CTCGAG // 

Xhol 


[0333] Les fragments Nhel-Xhol et BamHI-Xhol, contenant le cADN de la S, ont ensuite ete excises du plasmide 
pcDNA-Ssol, et sous-clones entre les sites correspondants du plasmide pTRIP-SD/SA-S-CTE et du plasmide pTRIP- 
SD/SA-S-WPRE, respectivement, pour obtenir les plasmides pTRIP-SD/SA-Ssol-CTE et pTRIP-SD/SA-Ssol-WPRE, 
deposes a la CNCM, le 1 er decembre 2004, sous les numeros 1-3337 et 1-3335, respectivement. 

[0334] Des vecteurs pseudotypes ont ete produits selon Zennou et coll. (2000, Cell, 101 : 173-185) et utilises pour 
transduire des cellules FRhK-4 (15000 cellules) selon une serie de 5 cycles successifs de transduction (15000 cellules) 
avec une quantite de vecteur correspondant a 24 ng (TRIP-SD/SA-Ssol-CTE) ou 40 ng TRIP-SD/SA-Ssol-WPRE) de 
p24 par cycle. Les cellules transduites ont ete donees par dilution limite et une serie de 16 clones transduits par TRIP- 
SD/SA-Ssol-CTE et de 15 clones par TRIP-SD/SA-Ssol-WPRE ont ete analyses pour I’expression du polypeptide Ssol 
par western blot revele par un anticorps monoclonal anti-FLAG (figure 26 et donnees non montrees), ainsi que par un 
ELISA-capture specifique du polypeptide Ssol qui a ete mis au point dans ce but (Tableau XI et donnees non montrees). 
Une partie du processus de selection des meilleurs clones secreteurs est montre dans la figure 26. L’ELISA-capture 
repose sur I’utilisation de phases solides recouvertes d’anticorps polyclonaux de lapins immunises par du SRAS-CoV 
purifie et inactive. Ces phases solides permettent la capture du polypeptide Ssol secrete dans les surnageants cellulaires, 
dont la presence est ensuite revelee par une serie d’etapes impliquant successsivement la fixation d'un anticorps 
monoclonal anti-FLAG (M2, SIGMA), d’anticorps biotinyles polyclonaux de lapin anti-lgG(H+L) de souris (Jackson) et 
d’un conjugue streptavidine-peroxidase (Amersham) puis I’addition de chromogene et de substrat (TMB + H 2 0 2 , KPL). 

Tableau XI : analyse de I’expression de polypeptide Ssol par des lignees cellulaires transduites par les 
vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol-CTE. La secretion du polypeptide Ssol a ete 
recherchee dans le surnageant d’une serie de clones cellulaires isoles apres transduction de cellules FRhK-4 par 
les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol-CTE. Les surnageants dilues au 1/50 ont ete 
analyses par un test ELISA-capture specifique de la S du SRAS-CoV. 


Vecteur 

Clone 

DO (450 nm) 

Temoin 

- 

0,031 

TRIP-SD/SA-Ssol-CTE 

CTE2 

0,547 

CTE3 

0,668 

CTE9 

0,171 

CTE12 

0,208 

CTE13 

0,133 
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(suite) 


Vecteur 

Clone 

DO (450 nm) 

TRIP-SD/SA-Ssol-WPRE 

WPRE1 

0,061 

WPRE10 

0,134 


[0335] La lignee cellulaire secretant les quantites les plus elevees de polypeptide Ssol dans le surnageant de culture 
est la lignee FRhK4-Ssol-CTE3. Elle a ete soumise a une deuxieme serie de 5 cycles de transduction par le vecteur 
TRIP-SD/SA-Ssol-CTE dans des conditions similaires a celles decrites ci-dessus puis donee. Le sous-clone secretant 
les quantites les plus eleves de Ssol a ete selectionne par une combinaison d’analyse par western blot et ELISA-capture : 
il s’agit du sous-clone FRhK4-Ssol-30, qui a ete depose a la CNCM, le 22 novembre 2004, sous le numero 1-3325. 
[0336] La lignee FRhK4-Ssol-30 permet la production et la purification en quantite du polypeptide recombinant Ssol. 
Dans une experience type oil les conditions experimentales de croissance, de production et de purification ont ete 
optimisees, les cellules de la lignee FRhK4-Ssol-30 sont ensemencees en milieu de culture standard (DMEM sans 
pyruvate contenant 4.5g/l de glucose et supplement par 5% de SVF, 100 U/ml de penicilline et 100 |j,g/ml de strepto- 
mycine) sous la forme d’une monocouche sous-confluente (1 million de cellules pour chaque 100 cm 2 dans 20 ml de 
milieu). A confluence, le milieu standard est remplace par le milieu de secretion ou la quantite de SVF est abaissee a 
0.5% et la quantite de milieu reduite a 16 ml pour chaque 100 cm 2 . Le surnageant de culture est preleve apres 4 a 5 
jours d’incubation a 35°C et sous 5% de C0 2 . Le polypeptide recombinant Ssol est purifie a partir du surnageant par 
I’enchaTnement d’etapes de filtration sur membrane de polyethersulfone (PES) de 0.1 |xm, de concentration par ultra¬ 
filtration sur une membrane de PES de point de coupure 50kD, de chromatographie d'affinite sur matrice anti-FLAG 
avec elution par une solution de peptide FLAG (DYKDDDDK) a 100 |a,g/ml en TBS (Tris 50mM pH 7.4, 150 mMNaCI) 
puis de chromatographie de gel filtration en TBS sur billes de sephadex G-75 (Pharmacia). La concentration du poly¬ 
peptide recombinant Ssol purifie a ete determinee par test micro-BCA (Pierce) puis ses caracteristiques biochimiques 
analysees. 

[0337] L’analyse par gel SDS a 8 % d’acrylamide colore au nitrate d'argent met en evidence un polypeptide majoritaire 
dont la masse moleculaire est d’environ 180kD et dont le degre de purete peut etre evalue a 98% (figure 27A). Par 
spectrometrie de masse SELDI-TOF (Cyphergen), deux pics principaux sont mis en evidence : ils correspondent a des 
formes simplement, et doublement chargees d'un polypeptide majoritaire dont la masse moleculaire est ainsi determinee 
a 182,6 ± 3,7 kD (figures 27B et C). Apres transfert sur membrane Prosorb et rincage en TFA 0,1%, I’extremite N- 
terminale du polypeptide Ssol a ete sequencee en phase liquide par degradation d’Edman sur 5 residus (ABI494, Applied 
Biosystems) et determinee comme etant SDLDR (figure 27D). Ceci demontre que le peptide signal localise a I’extremite 
N-terminale de la proteine S du SRAS-CoV, compose des aa 1 a 13 (MFIFLLFLTLTSG) d’apres une analyse realisee 
avec le logiciel signalP v2.0 (Nielsen et al., 1997, Protein Engineering, 10 : 1-6), est dive du polypeptide Ssol mature. 
Le polypeptide recombinant Ssol est done constitue des acides amines 14 a 1193 de la proteine S du SRAS-CoV 
fusionnes en C-terminal a une sequence SG DYKDDDDK contenant la sequence de I’etiquette FLAG (soulignee). L’ecart 
entre la masse molaire theorique du polypeptide Ssol nu (132,0 kD) et la masse molaire reelle du polypeptide mature 
(182,6 kD) suggere que le polypeptide Ssol est glycosyle. 

[0338] Une preparation de polypeptide Ssol purifie et dont la concentration proteique a ete determinee par test micro- 
BCA, permet de realiser une gamme etalon pour mesurer a I’aide du test ELISA-capture decrit plus haut les concentrations 
de Ssol present dans les surnageants de culture et de revisiter les caracteristiques des lignees secretrices. Selon ce 
test, la lignee FRhK4-Ssol-CT3 secrete 4 a 6 p,g/ml de polypeptide Ssol tandis que la lignee FRhK4-Ssol-30 secrete 9 
a 13 (j,g/ml de Ssol apres 4 a 5 jours de culture a confluence. En outre, le schema de purification presente plus haut 
permet en routine de purifier de 1 a 2 mg de polypeptide Ssol par litre de surnageant de culture. 

Exemple 12 : Immunisation genique visant la proteine de spicule (S) du coronavirus associe au SRAS (SRAS- 
CoV) 

[0339] L’effet d’un signal d’epissage et des signaux post-transcriptionnels WPRE et CTE a ete analyse apres immu¬ 
nisation genique de souris BALB/c (figure 28). 

[0340] Pour cela, des souris BALB/c ont ete immunisees a des intervalles de 4 semaines par injection dans le tibialis 
anterior d’une solution saline de 50 p,g d’ADN plasmidique de pcDNA-S et pCI-S ainsi que, a titre de controle, par 50 
p,g d’ADN plasmidique de pcDNA-N (dirigeant I’expression de la N du SRAS-CoV) ou de pCI-HA (dirigeant I’expression 
de la HA du virus grippal A/PR/8/34) et les serums immuns collectes 3 semaines apres la 2eme injection. La presence 
d’anticorps diriges contre la S du SRAS-CoV a ete recherchee par ELISA indirect en utilisant comme antigene un lysat 
de cellules VeroE6 infectees par le SRAS-CoV et a titre de controle, un lysat de cellules VeroE6 non infectees. Les titres 
(Tl) en anticorps anti-SRAS-CoV sont calcules comme I’inverse de la dilution produisant une DO specifique de 0,5 
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(difference entre DO mesuree sur lysat de cellules infectees et DO mesuree sur lysat de cellules non infectees) apres 
revelation par un anticorps polyclonal anti-IgG de souris couple a la peroxidase (NA931V, Amersham) et du TMB 
additionne de H 2 0 2 (KPL) (figure 28A). 

[0341] Dans ces conditions, le plasmide d'expression pcDNA-S ne permet I’induction que de faibles titres d’anticorps 
dirigees contre la S du SRAS-CoV chez 3 souris sur 6 (LOG 10 (TI)=1,9±0,6) alors que le plasmide pcDNA-N permet 
I’induction d’anticorps anti-N a des titres eleves (LOG 10 (TI)= 3,9±0,3) cheztous les animaux, et les plasmides controles 
(pCI, pCI-HA) n’entraTnent aucun anticorps detectable (LOG 10 (TI)<1,7). Le plasmide pCI-S muni d’un signal d’epissage 
permet I’induction d’anticorps a des titres eleves (LOG 10 (TI)= 3,7±0,2), qui sont environ 60 fois superieurs a ceux 
observes apres injection du plasmide pcDNA-S (p<10 -5 ). 

[0342] L’efficacite des signaux post-transcriptionnels a ete etudiee en realisant une etude dose-reponse des titres en 
anticorps anti-S induits chez la souris BALB/c en fonction de la quantite d’ADN plasmidique utilise comme immunogene 
(2|a,g, 10 pug et 50 (xg). Cette etude (figure 28B) demontre que le signal post-transcriptionnel WPRE ameliore fortement 
I’efficacite de I’immunisation genique lorsque de faibles doses d’ADN sont utilisees (p<10 _5 pour une dose de 2 |mg 
d’ADN et p<10 -2 pour une dose de 10 (xg), alors que I’effet du signal CTE reste marginal (p=0,34 pour une dose de 2 
(jig d’ADN). 

[0343] Enfin, les anticorps induits chez la souris apres immunisation genique neutralisent I’infectivite du SRAS-CoV 
in vitro (figures 29A et 29B) a des titres qui sont en rapport avec les titres mesures par ELISA. 

[0344] En resume, I’utilisation d’un signal d’epissage et du signal post-transcriptionnel WPRE du virus de I’hepatite 
de la marmotte ameliore de fagon considerable I’induction d’anticorps neutralisants diriges contre le SRAS-CoV apres 
immunisation genique a I’aide d’ADN plasmidique dirigeant I’expression du cADN de la S du SRAS-CoV. 

Exemple 13 : Applications diagnostiques de la proteine S 

[0345] La reactivite en ELISA du polypeptide recombinant Ssol a ete analysee vis-a-vis de serums de patients atteints 
de SRAS. 

[0346] Les serums de cas probables de SRAS testes ont ete choisis sur la base des resultats (positifs ou negatifs) 
d’analyse de leur reactivite specifique vis-a-vis des antigenes natifs du SRAS-CoV par test d’immunofluorescence sur 
cellules VeroE6 infectees par le SRAS-CoV et/ou par test ELISA indirect en utilisant comme antigene un lysat de cellules 
VeroE6 infectees par le SRAS-CoV. Les serums de ces patients sont identifies par un numero d’ordre du Centre National 
de Reference des Virus Influenzae ainsi que par les initiales du patient et le nombre de jours ecoules depuis le debut 
des symptomes. Tous les serums de cas probables (cf Tableau XII) reconnaissent les antigenes natifs du SRAS-CoV, 
a I’exception du serum 032552 du patient VTT, pour lequel I’infection par le SRAS-CoV n’a pas pu etre confirmee par 
RT-PCR realisee sur prelevements respiratoires des jours 3, 8 et 12. Un panel de serums temoin a ete utilise a titre de 
controle (serums TV): il s’agit de serums preleves en France avant I’epidemie de SRAS survenue en 2003. 


Tableau XII : serums de cas probables de SRAS 


serum 

patient 

jourde prelevement 

031724 

JYK 

7 

033168 

JYK 

38 

033597 

JYK 

74 

032632 

NTM 

17 

032634 

THA 

15 

032541 

PHV 

10 

032542 

NIH 

17 

032552 

VTT 

8 

032633 

PTU 

16 

032791 

JLB 

3 

033258 

JLB 

27 

032703 

JCM 

8 

033153 

JCM 

29 
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[0347] Des phases solides sensibilisees par le polypeptide recombinant Ssol ont ete preparees par adsorption d’une 
solution de polypeptide Ssol purifie a 2 |mg/ml en PBS dans les puits d’une plaque ELISA, puis les plaques sont incubees 
une nuit a 4°C et lavees avec du tampon PBS-Tween (PBS, 0,1% Tween20). Apres saturation des plaques ELISA par 
une solution de PBS-lait ecreme a 10% (poids/volume) et lavage en PBS-tween, les serums a tester (100 pi) sontdilues 
au 1/400 dans du tampon PBS-lait ecreme-Tween (PBS, 3% lait ecreme, 0,1% Tween) puis ajoutes dans les puits de 
la plaque ELISA sensibilisee. Les plaques sont incubees 1h a 37°C. Apres 3 lavages avec du tampon PBS-Tween, le 
conjugue anti-IgG humaines marque a la peroxidase (ref NA933V, Amersham) dilue au 1/4000 dans du tampon PBS- 
lait ecreme-Tween est ajoute, puis les plaques sont incubees une heure a 37°C. Apres 6 lavages avec du tampon PBS- 
Tween, le chromogene (TMB) et le substrat (H 2 0 2 ) sont ajoutes et les plaques sont incubees 10 minutes a I’abri de la 
lumiere. La reaction est arretee par ajout d’une solution IN de H 3 P0 4 , puis I’absorbance est mesuree a 450 nm avec 
un reference a 620nm. 

[0348] Les tests ELISA (figure 30) demontrent que le polypeptide recombinant Ssol est reconnu specifiquement par 
les anticorps seriques de patients atteints de SRAS preleves en phase moyenne ou tardive de I’infection (> 10 jours 
apres le debut des symptomes alors qu’il n’est pas reconnu de fagon significative par les anticorps seriques de deux 
patients (JLB et JCM) preleves en phase precoce de I’infection (3 a 8 jours apres le debut des symptomes) ni par des 
serums temoins de sujets non atteints de SRAS. Les anticorps seriques des patients JLB et JCM montrent une sero¬ 
conversion entre les jours 3 et 27 pour le premier et 8 et 29 pour le second apres le debut des symptomes, ce qui 
confirme la specificite de la reactivite de ces serums vis-a-vis du polypeptide Ssol. 

[0349] En conclusion, ces resultats demontrent que le polypeptide recombinant Ssol peut etre utilise comme antigene 
pour la mise au point d’un test ELISA de diagnostic serologique de I’infection par le SRAS-CoV. 

Exemple 14 : Applications vaccinales de la proteine S soluble recombinante 

[0350] L’immunogenicite du polypeptide recombinant Ssol a ete etudiee chez la souris. 

[0351] Pour cela, un groupe de 6 souris a ete immunise a 3 semaines d’intervalle avec 10 |a,g de polypeptide recom¬ 
binant Ssol adjuve par 1 mg d’hydroxyde d’aluminium (Alu-gel-S, Serva) dilue en PBS. Trois immunisations successives 
ont ete realisees et les serums immuns ont ete preleves 3 semaines apres chacune des immunisations (IS1, IS2, IS3). 
Atitre de controle, un groupe de souris (groupe mock) a regu de I’hydroxide d’aluminium seul selon le meme protocole. 
[0352] Les serums immuns ont ete analyses par pool pour chacun des 2 groupes par ELISA indirect en utilisant un 
lysat de cellules VeroE6 infectees par le SRAS-CoV comme antigene et a titre de controle, un lysat de cellules VeroE6 
non infectees. Les titres en anticorps anti-SRAS-CoV sont calcules comme I’inverse de la dilution produisant une DO 
specifique de 0,5 apres revelation par un anticorps polyclonal anti-lgG(H+L) de souris couple a la peroxidase (NA931 
V, Amersham) et du TMB additionne de H 2 0 2 (KPL). Cette analyse (figure 31) montre que I’immunisation par le poly¬ 
peptide Ssol induit chez la souris des la premiere immunisation des anticorps diriges contre la forme native de la proteine 
de spicule du SRAS-CoV presente dans le lysat de cellules VeroE6 infectees. Apres 2 puis 3 immunisations, les titres 
en anticorps anti-S deviennent tres eleves. 

[0353] Les serums immuns ont ete analyses par pool pour chacun des 2 groupes pour leur capacite a seroneutraliser 
I’infectivite du SRAS-CoV. 4 points de seroneutralisation sur cellules FRhK-4 (100TCID50 de SRAS-CoV) sont realises 
pour chacune des dilutions de raison 2 testees a partir du 1/20. Le titre seroneutralisant est calcule selon la methode 
de Reed et Munsch comme I’inverse de la dilution neutralisant I’infectivite de 2 cupules sur 4. Cette analyse montre que 
les anticorps induits chez la souris par le polypeptide Ssol sont neutralisants : les titres observes sont tres eleves apres 
2 puis 3 immunisations (superieurs a 2560 et 5120 respectivement, Tableau XIII). 

Tableau XIII : induction d’anticorps diriges contre le SRAS-CoV apres immunisation avec le polypeptide 
recombinant Ssol. Les serums immuns ont ete analyses par pool pour chacun des 2 groupes pour leur capacite a 
seroneutraliser I’infectivite de 100 TCID50 du SRAS-CoV sur cellules FRhK-4. 4 points sont realises pour chacune 
des dilutions de raison 2 testees a partir du 1/20. Le titre seroneutralisant est calcule selon la methode de Reed et 
Munsch comme I’inverse de la dilution neutralisant I’infectivite de 2 cupules sur 4. 


groupe 

serums 

Ac. Neutralisants 

Mock 

Pi 

< 20 

IS1 

<20 

IS2 

<20 

IS3 

<20 
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(suite) 


groupe 

serums 

Ac. Neutralisants 

Ssol 

pi 

< 20 

IS1 

57 

IS2 

>2560 

IS3 

> 5120 


[0354] Les titres neutralisants observes chez les souris immunisees avec le polypeptide Ssol atteignent des niveaux 
tres superieurs aux titres observes par Yang et coll, chez la souris (2004, Nature, 428: 561-564) et a ceux observes par 
Buchholz chez le hamster (2004, PNAS 101 : 9804-9809), qui protegent respectivement la souris et le hamster de 
I’infection par le SRAS-CoV. II est done vraisemblable que les anticorps neutralisants induits chez la souris apres 
immunisation par le polypeptide Ssol protegent ces animaux contre I’infection par le SRAS-CoV. 

Exemple 15 : Gene synthetique optimise pour I’expression en cellules de mammiferes de la proteine de spicule 
(S) du coronavirus associe au SRAS (SRAS-CoV). 

1) Conception du gene synthetique 

[0355] Un gene synthetique codant pour la proteine de spicule du SRAS-CoV a ete congu a partir du gene de I’isolat 
031589 (plasmide pSARS-S, C.N.C.M. n° 1-3059) de fagon a permettre des niveaux d’expression eleves dans des 
cellules de mammiferes et en particulier dans les cellules d'origine humaine. 

[0356] Pour cela : 

I’usage des codons du gene sauvage de I’isolat 031589 a ete modifie de fagon a se rapprocher du biais observe 
chez I’homme et a ameliorer I’efficacite de traduction du mRNA correspondant 

le contenu global en GC du gene a ete augmente de fagon a prolonger la demi-vie du mRNA correspondant 
les motifs, eventuellement cryptiques, susceptibles d’interferer avec une expression efficace du gene ont ete sup- 
primes (sites donneurs et accepteurs d’epissage, signaux de polyadenylation, sequences tres riches (>80%) ou 
tres pauvres (<30%) en GC, sequences repetees, sequences impliquees dans la formation de structures secondaires 
de I’ARN, boites TATA) 

un deuxieme codon STOP a ete ajoute pour permettre une terminaison efficace de la traduction. 

[0357] En outre, des motifs CpG ont ete introduits dans le gene de fagon a augmenter son immunogenicite comme 
vaccin a ADN. Afin de faciliter la manipulation du gene synthetique, deux sites de restriction BamHI et Xhol ont ete 
places de part et d’autre de la phase ouverte de lecture de la proteine S, et les sites de restriction BamHI, Xhol, Nhel, 
Kpnl, BspEI et Sail ont ete evites dans le gene synthetique. 

[0358] La sequence du gene synthetique congu (gene 040530) est donnee en SEQ ID No: 140. 

[0359] Un alignement du gene synthetique 040530 avec la sequence du gene sauvage de I’isolat 031589 du SRAS- 
CoV depose a la C.N.CM. sous le numero 1-3059 (SEQ ID NO : 4, plasmide pSRAS-S) est presente dans la figure 32. 

2) Constructions plasmidiques 

[0360] Le gene synthetique SEQ ID No: 140 a ete assemble a partir d’oligonucleotides synthetiques et clone entre 
les sites Kpnl et Sacl du plasmide pUC-Kana pourdonner le plasmide 040530pUC-kana. La sequence nucleotidique 
de I'insert du plasmide 040530pUC-kana a ete verifiee par sequengage automatique (Applied). 

[0361] Un fragment Kpnl-Xhol contenant le gene synthetique 040530 a ete excise du plasmide 040530pUC-kana et 
sous-clone entre les sites Nhel etXhol du plasmide d’expression pCI (Promega) pourobtenirle plasmide pCI-SSYNTH, 
depose a la CNCM le 1 er decembre 2004, sous le numero 1-3333. 

[0362] Un gene synthetique codant pour la forme soluble de la proteine S a ensuite ete obtenu en fusionnant les 
sequences synthetiques codant pour I’ectodomaine de la proteine S (acides amines 1 a 1193) a celles de I’etiquette 
(FLAG : DYKDDDDK) via un linker BspEI codant pour le dipeptide SG. Pratiquement, un fragment d’ADN codant pour 
I’ectodomaine de la S du SRAS-CoV a ete amplifie par PCR a I’aide des oligonucleotides 5-ACTA GCTAGC GGATC- 
CACC A TG TTCATCTT CCTG -3’ et 5’- AGTA TCCGGA C TTGATGTACT GCTCGTACTT GC-3’ a partir du plasmide 
040530pUC-kana, digere par Nhel et BspEI puis insere entre les sites uniques Nhel et BspEI du plasmide pCI-Ssol, 
pour donner le plasmide pCI-SCUBE, depose a la CNCM le 1 er decembre 2004, sous le numero 1 -3332. (Les plasmides 
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pCI-Ssol, pCI-Ssol-CTE et pCI-Ssol-WPRE (depose a la CNCM, le 22 novembre 2004, sous le nurmero 1-3324) avaient 
ete precedemment obtenus par sous-clonage du fragment Kpnl-Xhol excise du plasmide pcDNA-Ssol (voir note tech¬ 
nique de la Dl 2004-106) entre les sites Nhel et Xhol des plasmides pCI, pCI-S-CTE et pCI-S-WPRE respectivement.) 
[0363] Les plasmides pCI-Scube et pCI-Ssol codent pour le meme polypeptide recombinant Ssol. 

3) Resultats 

[0364] La capacite du gene synthetique codant pour la proteine S a diriger efficacement I’expression de la S du SRAS- 
CoV dans des cellules de mammiferes a ete comparee a celle du gene sauvage apres transfection transitoire de cellules 
de primates (VeroE6) et de cellules humaines (293T). 

[0365] Dans I’experience presentee par la figure 33 et au Tableau XIV, des monocouches de 5x10 s cellules VeroE6 
ou 7x10 5 cellules 293T en boites de Petri de 35mm ont ete transferees avec 2 (xg des plasmides pCI (a titre de controle), 
pCI-S, pCI-S-CTE, pCI-S-WPRE et pCI-Ssynth et 6 |xl de reactif Fugene6 selon les indications du fabricant (Roche). 
Apres 48 heures d’incubation a 37°C et sous 5% de C0 2 , des extraits cellulaires ont ete prepares en tampon de depot 
selon Laemmli, separes sur un gel SDS a 8% de polyacrylamide puis transferes sur une membrane de PVDF (BioRad). 
La detection de cette immunoempreinte (« western blot ») a ete realisee a I'aide d’un serum polyclonal de lapin anti-S 
(immun-serum du lapin Pill35 : cf exemple 4 ci-dessus) et d’anticorps polyclonaux d’ane diriges contre les IgG de 
lapin et couples a la peroxidase (NA934V, Amersham). L’immunoempreinte est revelee de fagon quantitative par lumi¬ 
nescence a I'aide du kit ECL+ (Amersham) et acquisition sur un dispositif d’imagerie numerique (FluorS, BioRad). 
[0366] L’analyse des resultats obtenus avec le logiciel QuantityOne v4.2.3 (BioRad) montre que dans cette experience, 
le plasmide pCI-Synth permet I'expression transitoire de la proteine S a des niveaux eleves dans les cellules VeroE6 
et 293T, alors que le plasmide pCI-S ne permet pas d’induire une expression a des niveaux suffisants pour etre detectee. 
Les niveaux d’expression observes sont de I'ordre de 2 fois superieurs a ceux observes avec le plasmide pCI-S-WPRE. 

Tableau XIV : utilisation d’un gene synthetique pour I’expression de la S du SRAS-CoV. Des extraits cellulaires 
prepares 48 heures apres transfection de cellulesVeroE6 ou 293T par les plasmides pCI, pCI-S, pCI-S-CTE, pCI-S- 
WPRE et pCI-Ssynth ont ete separes sur un gel SDS a 8% d’acrylamide et analyses par western blot a I'aide d’un 
anticorps polyclonal de lapin anti-S et d’un anticorps polyclonal anti-lgG(H+L) de lapin couple a la peroxidase (NA934V, 
Amersham). Le western blot est revele par luminescence (ECL+, Amersham) et acquisition sur un dispositif d'imagerie 
numerique (FluorS, BioRad). Les niveaux d’expression de la proteine S ont ete mesures en quantifiant les 2 bandes 
majoritaires reperees sur I’image (voir figure 33) et sont indiques en fonction d’une echelle arbitraire ou la valeur de 


1 represente le niveau mesure apres transfection du plasmide pCI-S-WPRE. 


plasmide 

VeroE6 

293T 

pCI 

0,0 

0,0 

pCI-S 

<0,1 

<0,1 

pCI-S-CTE 

0,5 

<0,1 

pCI-S-WPRE 

1,0 

1,0 

PCI-Ssynth 

1,8 

1,9 


[0367] Dans un second temps, la capacite du gene synthetique Scube a diriger efficacement la synthese et la secretion 
du polypeptide Ssol par des cellules de mammiferes a ete comparee a celle du gene sauvage apres transfection transitoire 
de cellules de hamster (BHK-21) et de cellules humaines (293T). 

[0368] Dans I’experience presentee par le Tableau XV, des monocouches de 6x10 5 cellules BHK-21 et de 7x10 5 
cellules 293T en boites de Petri de 35mm ont ete transferees avec 2 |j,g des plasmides pCI (a titre de controle), pCI- 
Ssol, pCI-Ssol-CTE, pCI-Ssol-WPRE et pCI-Scube et 6 p.1 de reactif Fugene6 selon les indications du fabricant (Roche). 
Apres 48 heures d'incubation a 37°C et sous 5% de C02, les surnageants cellulaires ont ete preleves et analyses de 
fagon quantitative pour la secretion du polypeptide Ssol par un test ELISA-capture specifique du polypeptide Ssol. 
[0369] L’analyse des resultats montre que, dans cette experience, le plasmide pCI-Scube permet I’expression du 
polypeptide Ssol a des niveaux 8 fois (cellules BHK-21) a 20 fois (cellules 293T) plus eleves que le plasmide pCI-Ssol. 
Les niveaux d’expression observes sont de I’ordre de 2 fois (cellules 293T) a 5 fois (cellules BHK-21) superieurs a ceux 
observes avec le plasmide pCI-Ssol-WPRE. 
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Tableau XV : utilisation d’un gene synthetique pour I’expression du polypeptide Ssol. Les surnageants ont 
ete recoltes 48 heures apres transfection de cellules BHK ou 293T par les plasmides pCI, pCI-Ssol, pCI-Ssol-CTE, 
pCI-Ssol-WPRE et pCI-Scube et analyses de fagon quantitative pour la secretion du polypeptide Ssol par un test 
ELISA-capture specifique du polypeptide Ssol. Les transfections ont ete realisees en dupliques et les resultats sont 
indiques sous la forme de moyennes et ecart-types des concentrations de polypeptide Ssol (ng/ml) mesurees dans 


les surnageants. 


Plasmide 

BHK 

293T 

Pci 

< 20 

< 20 

pCI-Ssol 

< 20 

56 ± 10 

pCI-Ssol-CTE 

< 20 

63 ± 8 

pCI-Ssol-WPRE 

28 ± 1 

531 ± 15 

PCI-Scube 

152 ± 6 

1140 ± 20 


[0370] En resume, ces resultats montrent que I’expression dans des cellules de mammiferes du gene synthetique 
040530 codant pour la S du SRAS-CoV sous la dependance de sequences promotrices de I’ARN polymerase II est bien 
plus efficace que celle du gene sauvage de I’isolat 031589. Cette expression est meme plus efficace que celle dirigee 
par le gene sauvage en presence des sequences WPRE du virus de I’hepatite de la marmotte. 

4) Applications 

[0371] L’utilisation du gene synthetique 040530 codant pour la S du SRAS-CoV ou de sa variante Scube codant pour 
le polypeptide Ssol est susceptible de remplacer avantageusement le gene sauvage dans de nombreuses applications 
oil I’expression de la S est necessaire a des niveaux eleves. En particulier pour: 

ameliorer I’efficacite de I’immunisation genique par des plasmides du type pCI-Ssynth voire pCI-Ssynth-CTE ou 
pCI-Ssynth-WPRE 

etablir de nouvelles lignees cellulaires exprimant des quantites plus elevees de la proteine S ou du polypeptide Ssol 
a I’aide de vecteurs lentiviraux recombinants porteurs du gene Ssynth ou du gene Scube respectivement 
ameliorer I’immunogenicite des vecteurs lentiviraux recombinants permettant I’expression de la proteine S ou du 
polypeptide Ssol 

ameliorer I'immunogenicite de vecteurs vivants permettant I’expression de la proteine S ou du polypeptide Ssol 
comme des virus recombinants de la vaccine ou des virus rougeole recombinants (voir exemples 16 et 17 ci-apres) 

Exemple 16 : Expression de la proteine de spicule (S) du coronavirus associe au SRAS (SRAS-CoV) a I’aide 
de virus recombinants de la Vaccine. 

Application vaccinale. 

Application a la production d’une forme soluble de la proteine de spicule (S) et conception d’un test de serologie 
du SRAS. 

1) Introduction 

[0372] Le but de cet exemple est d’evaluer la capacite de virus recombinants de la vaccine (VV) exprimant differents 
antigenes du coronavirus associe au SRAS (SRAS-CoV) a constituer de nouveaux candidats vaccins contre le SRAS 
et un moyen de produire des antigenes recombinants en cellules de mammiferes. 

[0373] Pour cela, les inventeurs se sont interesses a la proteine de spicule (S) du SRAS-CoV, qui permet d’induire 
apres immunisation genique chez I’animal des anticorps neutralisants I’infectivite du SRAS-CoV, ainsi qu’a une forme 
soluble et secretee de cette proteine, le polypeptide Ssol, qui est compose de I’ectodomaine (aa 1-1193) de la Sfusionne 
en son extremite C-tera une etiquette FLAG (DYKDDDDK) via un linker BspEI codant pour le dipeptide SG. Ce polypeptide 
Ssol presente une antigenicite similaire a celle de la proteine S et permet, apres injection a la souris sous la forme d’une 
proteine purifiee adjuvee en hydroxide d’aluminium, I’induction de titres eleves d’anticorps neutralisants contre le SRAS- 
CoV. 


59 












5 

10 

15 

20 

25 

30 

35 

40 

45 

50 

55 


EP 1 694 829 B1 


[0374] Les differentesformes du gene S ont ete placees sous la dependance du promoteur du gene 7.5K puis introduites 
au sein du locus de la thymidine kinase (TK) de la souche Copenhague du virus de la vaccine par double recombinaison 
homologue in vivo. Afin d'ameliorer I’immunogenicite des virus vaccine recombinants, un promoteur tardif synthetique 
a ete choisi a la place du promoteur 7.5K, pour augmenter la production de S et Ssol au cours des phases tardives du 
cycle viral. 

[0375] Apres avoir isole les virus vaccine recombinants et verifie leur capacite a exprimer I’antigene S du SRAS-CoV, 
leur capacite a induire chez la souris une reponse immunitaire contre le SRAS a ete testee. Apres avoir purifie I’antigene 
Ssol du surnageant de cellules infectees, un test ELISA de serodiagnostic du SRAS a ete congu, et son efficacite a ete 
evaluee a I’aide de serums de cas probables de SRAS. 

2) Construction des virus recombinants 

[0376] Des virus recombinants de la vaccine dirigeant I’expression de la glycoproteine S de I’isolat 031589 du SRAS- 
CoV et d’une forme soluble et secretee de cette proteine, le polypeptide Ssol, sous la dependance du promoteur 7.5K 
ont ete obtenus. Dans le but d'augmenter les niveaux d'expression de S et Ssol, des virus recombinants dans lesquels 
les cDNA de S et de Ssol sont places sous la dependance d'un promoteur synthetique tardif ont egalement ete obtenus. 
[0377] Le plasmide pTG186poly est un plasmide de transfert pour la construction de virus recombinants de la vaccine 
(Kieny, 1986, Biotechnology, 4 :790-795). A ce titre, il contient le gene de la thymidine kinase du VV dans lequel a ete 
insere le promoteur du gene 7.5K suivi d’un site multiple de clonage permettant I’insertion de genes heterologues (figure 
34A). Le promoteur du gene 7.5K contient en fait un tandem de deux sequences promotrices actives respectivement 
durant les phases precoces (P E ) et tardives (P L ) du cycle de replication du virus de la vaccine. Les fragments BamHI- 
Xhol ont ete excises des plasmides pTRIP-S et pcDNA-Ssol respectivement et inseres entre les sites BamHI et Smal 
du plasmide pTG186poly pour donner les plasmides pTG-S et pTG-Ssol (figure 34A). Les plasmides pTG-S et pTG- 
Ssol ont ete deposes a la CNCM, le 2 decembre 2004, sous les numeros 1-3338 et 1-3339, respectivement. 

[0378] Les plasmides pTN480, pTN-S et pTN-Ssol ont ete obtenus a partir des plasmides pTG186poly, pTG-S et 
pTG-Ssol respectivement, en substituant le fragment Ndel-Pstl contenant le promoteur 7.5K par un fragment d’ADN 
contenant le promoteur tardif synthetique 480, qui a ete obtenu par hybridation des oligonucleotides 5’- TATGAGCTTT 
TTTTTTTTTT TTTTTTTGGC ATATAAATAG ACTCGGCGCG CCATCTGCA-3’ et 5’- GATGGCGCGC CGAGTCTATT 
TATATGCCAA AAAAAAAAAA AAA.AAAAAGC TCA-3’ (figure 34B). L’insert a ete sequence a I’aide d’un kit BigDye 
Terminator vl.1 (Applied Biosystems) et d’un sequenceur automatique ABI377. La sequence du promoteur synthetique 
tardif 480 tel que clone dans les plasmides de transfert de la serie pTN est indiquee figure 34C. Les plasmides pTN-S 
et pTN-Ssol ont ete deposes a la CNCM, le 2 decembre 2004, sous les numeros 1-3340 et 1-3341, respectivement. 
[0379] Les virus recombinants de la vaccine ont ete obtenus par double recombinaison homologue in vivo entre la 
cassette TK des plasmides de transfert des series pTG et pTN et le gene TK de la souche Copenhague du virus de la 
vaccine selon une procedure decrite par Kieny et coll. (1984, Nature, 312:163-166). Brievement, des cellules CV-1 sont 
transferees a I’aide de DOTAP (Roche) par de I'ADN genomique de la souche copenhague du virus de la vaccine et 
chacun des plasmides de transfert des series pTG et pTN decrits ci-dessus, puis surinfectees par le virus vaccine 
auxiliaire VV-ts7 pendant 24 heures a 33°C. Le virus auxiliaire est contre-selectionne par incubation a 40°C pendant 2 
jours puis les virus recombinants (phenotype TK-) selectionnes par deux cycles de clonage sous milieu gelose sur 
cellules 143Btk- en presence de BuDr (25 p,g/ml). Les 6 virus VV-TG, VV-TG-S, VV-TG-Ssol, VV-TN, VV-TN-S et VV- 
TN-Ssol ont ete respectivement obtenus a I’aide des plasmides de transfert pTG186poly, pTG-S, pTG-Ssol, pTN480, 
pTN-S, pTN-Ssol. Les virus VV-TG et VV-TN n’expriment aucun gene heterologue et ont ete utilises comme controle 
TK- dans les experiences. Les preparations de virus recombinants ont ete realises sur monocouches de cellules CV-1 
ou BHK-21 et le titre en unites formant plage (u.f.p.) determine sur cellules CV-1 selon Earl et Moss (1998, Current 
Protocols in Molecular Biology, 16.16.1-16.16.13). 

3) Caracterisation des virus recombinants 

[0380] L’expression des transgenes codant la proteine S et le polypeptide Ssol a ete recherchee par western blot. 
[0381] Des monocouches de cellules CV-1 ont ete infectees a une multiplicity de 2 par les differents virus vaccine 
recombinants VV-TG, VV-TG-S, VV-TG-Ssol, VV-TN, VV-TN-S et VV-TN-Ssol. Apres 18 heures d’incubation a 37°C 
et sous 5% de C02, des extraits cellulaires ont ete prepares en tampon de depot selon Laemmli, separes sur un gel 
SDS a 8% de polyacrylamide puis transferes sur une membrane de PVDF (BioRad). La detection de cette immunoem- 
preinte (« western blot ») a ete realisee a I’aide d’un serum polyclonal de lapin anti-S (immun-serum du lapin Pill35 : 
cf exemple 4) et d’anticorps polyclonaux d’ane diriges contre les IgG de lapin et couples a la peroxidase (NA934V, 
Amersham). Les anticorps fixes ont ete reveles par luminescence a I’aide du kit ECL+ (Amersham) et de films d’auto- 
radiographie Hyperfilm MP (Amersham). 

[0382] Comme le montre la figure 35A, le virus recombinant VV-TN-S dirige I’expression de la proteine S a des niveaux 
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qui sont comparables a ceux que Ton peut observer 8h apres infection par le SRAS-CoV mais qui sont bien plus eleves 
que ceux que I’on peut observer apres infection par W-TG-S. Dans une deuxieme experience (figure 35B), I’analyse de 
quantites variables d’extraits cellulaires montre que les niveaux d’expression observes apres infection par les virus de 
la serie TN (VV-TN-S et VV-TN-Ssol) sont environ 10 fois plus eleves que ceux observes avec les virus de la serie TG 
(VV-TG-S et VV-TG-Ssol respectivement). En outre, le polypeptide Ssol est secrete dans le surnageant de cellules CV- 
1 infectees par le virus VV-TN-Ssol plus efficacement que dans le surnageant de cellules infectees par VV-TG-Ssol 
(figure 36A). Dans cette experience, le virus VV-TN-Sflag a ete utilise a titre de controle, car il exprime la forme mem- 
branaire de la proteine S fusionnee en son extremite C-ter a I’etiquette FLAG. La proteine Sflag n'est pas detectee dans 
le surnageant des cellules infectees par VV-TN-Sflag, demontrant que le polypeptide Ssol est bien secrete de fagon 
active apres infection par VV-TN-Ssol. 

[0383] Ces resultats demontrent que les virus vaccine recombinants sont bien porteurs des transgenes et permettent 
I’expression de la glycoproteine du SRAS sous sa forme membranaire (S) ou sous une forme soluble et secretee (Ssol). 
Les virus vaccine porteurs du promoteur synthetique 480 permettent I'expression de S et la secretion de Ssol a des 
niveaux bien plus eleves que les virus porteurs du promoteur du gene 7.5K. 

4) Application a la production d’une forme soluble de la S du SRAS-CoV. Purification de cet antigene recom¬ 
binant et applications diagnostiques. 

[0384] La lignee BHK-21 est la lignee cellulaire qui secrete les quantites les plus elevees de polypeptide Ssol apres 
infection par le virus VV-TN-Ssol parmi les lignees testees (BHK-21, CV1, 293T et FrhK-4, figure 36B); elle permet la 
production et la purification en quantite du polypeptide recombinant Ssol. Dans une experience type ou les conditions 
experimentales d’infection, de production et de purification ont ete optimisees, les cellules BHK-21 sont ensemencees 
en milieu de culture standard (DMEM sans pyruvate contenant 4.5g/l de glucose et supplements par 5% de TPB, 5% 
de SVF, 100 U/ml de penicilline et 100 |a,g/ml de streptomycine) sous la forme d’une monocouche sous-confluente (10 
millions de cellules pour chaque 100 cm 2 dans 25 ml de milieu). Apres 24h d’incubation a 37°C sous 5% de C0 2 , les 
cellules sont infectees a une M.O.I. de 0.03 et le milieu standard remplace par le milieu de secretion ou la quantite de 
SVF est abaissee a 0.5% et le TPB supprime. Le surnageant de culture est preleve apres 2,5 jours d’incubation a 35°C 
et sous 5% de C0 2 et le virus de la vaccine inactive par addition de triton X-100 (0,1%). Apres filtration sur membrane 
de polyethersulfone (PES) de 0.1 |xm, le polypeptide recombinant Ssol est purifie par une chromatographie d’affinite 
sur matrice anti-FLAG avec elution par une solution de peptide FLAG (DYKDDDDK) a 100 |xg/ml en TBS (Tris 50mM 
pH 7.4, 150 mMNaCI). 

[0385] L’analyse par gel SDS a 8 % d’acrylamide colore au nitrate d’argent a mis en evidence un polypeptide majoritaire 
dont la masse moleculaire est d’environ 180kD et dont le degre de purete est superieur a 90% (figure 37).La concentration 
du polypeptide recombinant Ssol purifie a ete determinee par comparaison avec les marqueurs de masse moleculaire 
et estimee a 24 ng/|ml. 

[0386] Cette preparation de polypeptide Ssol purifie permet de realiser une gamme etalon pour mesurer a I’aide d’un 
test ELISA-capture les concentrations de Ssol presentes dans les surnageants de culture. Selon ce test, la lignee BHK- 
21 secrete environ 1 |i,g/ml de polypeptide Ssol dans les conditions de production decrites plus haut. En outre, le schema 
de purification presente permet de purifier de I’ordre de 160 |j,g de polypeptide Ssol par litre de surnageant de culture. 
[0387] La reactivite en ELISA du polypeptide recombinant Ssol a ete analysee vis-a-vis de serums de patients atteints 
de SRAS. 

[0388] Les serums de cas probables de SRAS testes ont ete choisis sur la base des resultats (positifs ou negatifs) 
d'analyse de leur reactivite specifique vis a vis des antigenes natifs du SRAS-CoV par test d’immunofluorescence sur 
cellules VeroE6 infectees par le SRAS-CoV et/ou par test ELISA indirect en utilisant comme antigene un lysatde cellules 
VeroE6 infectees par le SRAS-CoV. Les serums de ces patients sont identifies par un numero d'ordre du Centre National 
de Reference des Virus Influenzae ainsi que par les initiales du patient et le nombre de jours ecoules depuis le debut 
des symptomes. Tous les serums de cas probables (cf Tableau XVI) reconnaissent les antigenes natifs du SRAS-CoV 
a I’exception du serum 032552 du patient VTT, pour lequel I’infection par le SRAS-CoV n’a pas pu etre confirmee par 
RT-PCR realisee sur prelevements respiratoires des jours 3, 8 et 12. Un panel de serums temoin a ete utilise a titre de 
controle (serums TV): il s’agit de serums preleves en France avant I’epidemie de SRAS survenue en 2003. 


Tableau XVI : serums de cas probables de SRAS 


serum 

patient 

jour de prelevement 

033168 

JYK 

38 

033597 

JYK 

74 

032632 

NTM 

17 
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(suite) 


serum 

patient 

jour de prelevement 

032634 

THA 

15 

032541 

PHV 

10 

032542 

NIH 

17 

032552 

VTT 

8 

032633 

PTU 

16 


[0389] Des phases solides sensibilisees par le polypeptide recombinant Ssol ont ete preparees par adsorption d’une 
solution de polypeptide Ssol purifie a 4 |a,g/ml en PBS dans les puits d’une plaque ELISA. Les plaques sont incubees 
une nuit a 4°C puis lavees avec du tampon PBS-Tween (PBS, 0,1 % Tween20). Apres lavage en PBS-tween, les serums 
a tester (100 pi) sont dilues au 1/100 et 1/400 dans du tampon PBS-lait ecreme-Tween (PBS, 3% lait ecreme, 0,1% 
Tween) puis ajoutes dans les puits de la plaque ELISA sensibilisee. Les plaques sont incubees 1h a 37°C. Apres 3 
lavages avec du tampon PBS-Tween, le conjugue anti-IgG humaines marque a la peroxidase (ref NA933V, Amersham) 
dilue au 1/4000 dans du tampon PBS-lait ecreme-Tween est ajoute puis les plaques sont incubees une heure a 37°C. 
Apres 6 lavages avec du tampon PBS-Tween, le chromogene (TMB) et le substrat (H 2 0 2 ) sont ajoutes et les plaques 
sont incubees 10 minutes a I'abri de la lumiere. La reaction est arretee par ajout d’une solution 1M de H 3 P0 4 puis 
I’absorbance est mesuree a 450 nm avec une reference a 620nm. 

[0390] Les tests ELISA (figure 38) demontrent que le polypeptide recombinant Ssol est reconnu specifiquement par 
les anticorps seriques de patients atteints de SRAS preleves en phase moyenne ou tardive de I’infection (> 10 jours 
apres le debut des symptomes), alors qu’il n’est pas reconnu de fagon significative par les anticorps seriques des serums 
temoins de sujets non atteints de SRAS. 

[0391] En conclusion, ces resultats demontrent que le polypeptide recombinant Ssol peut etre purifie a partir du 
surnageant de cellules de mammiferes infectees par le virus vaccine recombinant W-TN-Ssol et etre utilise comme 
antigene pour la mise au point d’un test ELISA de diagnostic serologique de I’infection par le SRAS-CoV. 

5) Applications vaccinales 

[0392] L’immunogenicite des virus vaccine recombinants a ete etudiee chez la souris. 

[0393] Pour cela, des groupes de 7 souris BALB/c ont ete immunises par voie i.v. a deux reprises a 4 semaines 
d’intervalle par 10 6 u.f.p. de virus vaccine recombinants VV-TG, VV-TG-S, W-TG-Ssol, W-TN, W-TN-S et VV-TN-Ssol 
ainsi que, a titre de controle, VV-TG-HA qui dirige I’expression de I’hemagglutinine de la souche A/PR/8/34 du virus de 
la grippe. Les serums immuns ont ete preleves 3 semaines apres chacune des immunisations (IS1, IS2). 

[0394] Les serums immuns ont ete analyses par pool pour chacun des groupes par ELISA indirect en utilisant un lysat 
de cellules VeroE6 infectees par le SRAS-CoV comme antigene et a titre de controle, un lysat de cellules VeroE6 non 
infectees. Les titres (Tl) en anticorps anti-SRAS-CoV sont calcules comme I’inverse de la dilution produisant une DO 
specifique de 0,5 apres revelation par un anticorps polyclonal anti-lgG(H+L) de souris couple a la peroxidase (NA931V, 
Amersham) et du TMB additionne de H 2 0 2 (KPL). Cette analyse (figure 39A) montre que I’immunisation par le virus 
VV-TG-S et W-TN-S induit chez la souris des la premiere immunisation des anticorps diriges contre la forme native de 
la proteine de spicule du SRAS-CoV presente dans le lysat de cellules VeroE6 infectees. Les reponses induites par le 
virus VV-TN-S sont plus elevees que celles induites par le virus VV-TG-S apres la premiere (Tl=740 et Tl=270 respec- 
tivement) et la deuxieme (Tl=3230 et Tl=600 respectivement) immunisation. Le virus VV-TN-Ssol induit de forts titres 
d’anticorps anti-SRAS-CoV apres deux immunisations (Tl=640), alors que le virus VV-TG-Ssol induit une reponse a la 
limite de la detection (Tl=40). 

[0395] Les serums immuns ont ete analyses par pool pour chacun des groupes pour leur capacite a seroneutraliser 
I’infectivite du SRAS-CoV. 4 points de seroneutralisation sur cellules FRhK-4 (100 TCID50 de SRAS-CoV) sont realises 
pour chacune des dilutions de raison 2 testees a partir du 1/20. Le titre seroneutralisant est calcule selon la methode 
de Reed et Munsch comme I’inverse de la dilution neutralisant I’infectivite de 2 cupules sur 4. Cette analyse montre que 
les anticorps induits chez la souris par les virus vaccine exprimant la proteine S ou le polypeptide Ssol sont neutralisants 
et que les virus a promoteurs synthetiques sont des immunogenes plus efficaces que les virus porteurs du promoteur 
7.5K : les titres les plus eleves (640) sont observes apres 2 immunisations par le virus VV-TN-S (figure 39B). 

[0396] Le pouvoir protecteur des anticorps neutralisants induits chez la souris apres immunisation par les virus vaccine 
recombinants est evalue a I’aide d’une infection d’epreuve par le SRAS-CoV. 
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6) Autres applications 

[0397] Des virus vaccine recombinants de troisieme generation sont construits en substituant les sequences sauvages 
des genes S et Ssol par des genes synthetiques optimises pour I’expression en cellules de mammiferes, decrits ci- 
dessus. Ces virus vaccine recombinants sont susceptibles d’exprimer des quantites plus importantes des antigenes S 
et Ssol et done de presenter une immunogenicite accrue. 

[0398] Le virus vaccine recombinant VV-TN-Ssol peut etre utilise pour la production en quantite et la purification de 
I’antigene Ssol en vue d’applications diagnostiques (serologie par ELISA) et vaccinales (vaccin sous-unitaire). 

Exemple 17 : Virus recombinant de la rougeole exprimant la proteine de spicule (S) du coronavirus associe 
au SRAS (SRAS-CoV). Applications vaccinales. 

1) Introduction 

[0399] Le vaccin rougeole (MV) induit chez I’homme une immunite protectrice de longue duree apres une seule 
injection (Hilleman, 2002, Vaccine, 20 : 651-665). La protection conferee esttres robuste et repose sur I’induction d’une 
reponse en anticorps et d’une reponse cellulaire CD4 et CD8. Le genome du MV est tres stable et aucune reversion 
vers la virulence des souches vaccinales n’a jamais ete observee. Le virus de la rougeole appartient au genre des 
Morbillivirus de la famille des Paramyxoviridae ; e’est un virus enveloppe dont le genome est un ARN monocatenaire 
de polarite negative de 16kb (figure 40A) et dont le cycle de replication exclusivement cytoplasmique exclut toute 
possibility d'integration dans le genome de I’hote. Le vaccin rougeole est ainsi I’un des vaccins vivants les plus efficaces 
et les plus surs utilises dans la population humaine. L’equipe de Frederic Tangy a developpe recemment un vecteur 
d’expression sur la base de la souche Schwarz du virus de la rougeole, qui est la souche attenuee la plus sure et la 
plus utilisee chez I'homme comme vaccin contre la rougeole. Cette souche vaccinale peut etre isolee a partir d’un clone 
moleculaire infectieux en conservant son immunogenicite chez les primates ainsi que chez la souris susceptible a 
I’infection. Elle constitue, apres insertion d’unites de transcription supplementaires, un vecteur pour I’expression de 
sequences heterologues (Combredet, 2003, J. Virol. 77 :11546-11554). En outre, un MV Schwarz recombinant exprimant 
la glycoproteine d’enveloppe du virus West Nile (WNV) induit une reponse en anticorps efficace et de longue duree qui 
protege la souris d’une infection d’epreuve letale par le WNV (Despres et al, 2004, J. Infect. Dis., sous presse). Toutes 
ces caracteristiques font de la souche attenuee Schwarz du virus de la rougeole un candidat vecteur extremement 
prometteur pour la construction de nouveaux vaccins vivants recombinants. 

[0400] Le but de cet exemple est d’evaluer la capacite de virus recombinants de la rougeole (MV) exprimant differents 
antigenes du coronavirus associe au SRAS (SRAS-CoV) a constituer de nouveaux candidats vaccins contre le SRAS. 
[0401] Les inventeurs se sont interesses a la proteine de spicule (S) du SRAS-CoV, qui permet d’induire apres 
immunisation genique chez I’animal des anticorps neutralisants I’infectivite du SRAS-CoV, ainsi qu’a une forme soluble 
et secretee de cette proteine, le polypeptide Ssol, qui est compose de I’ectodomaine (aa 1-1193) de la S fusionne en 
son extremite C-ter a une etiquette FLAG (DYKDDDDK) via un linker BspEI codant pour le dipeptide SG. Ce polypeptide 
Ssol presente une antigenicite similaire a celle de la proteine S et permet, apres injection a la souris sous la forme d’une 
proteine purifiee adjuvee en hydroxide d’aluminium, I’induction de titres eleves d’anticorps neutralisants contre le SRAS- 
CoV. 

[0402] Les differentes formes du gene S ont ete introduites sous la forme d’une unite de transcription supplementaire 
entre les genes P (phosphoproteine) et M (matrice) dans le cADN de la souche Schwarz du MV precedemment decrite 
(Combredet, 2003, J. Virol. 77 : 11546-11554 ; Demande EP N° 02291551.6 du 20 juin 2002, et Demande EP n° 
02291550.8 du 20 juin 2002). Apres avoir isole les virus recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol et 
verifie leur capacite a exprimer I’antigene S du SRAS-CoV, leur capacite a induire chez la souris puis chez le singe une 
reponse immunitaire protectrice contre le SRAS est testee. 

2) Construction des virus recombinants 

[0403] Le plasmide pTM-MVSchw-ATU2 (figure 40B) contient un cADN infectieux correspondant a I’antigenome de 
la souche vaccinale Schwarz du virus de la rougeole (MV) dans lequel une unite de transcription supplementaire (ATU) 
a ete introduite entre les genes P (phosphoproteine) et M (matrice) (Combredet, 2003, Journal of Virology, 77 : 
11546-11554). Des genomes recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol du virus de la rougeole ont 
ete construits par I’insertion des ORFs de la proteine S et du polypeptide Ssol au sein de I’unite de transcription sup¬ 
plementaire du vecteur MVSchw-ATU2. 

[0404] Pour cela, un fragment d'ADN contenant le cADN de la S du SRAS-CoV a ete amplifie par PCR a I’aide des 
oligonucleotides 5’-ATACGTACGA CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3’ et 5’-ATAGCGCGCT CAT- 
TATGTGT AATGTAATTT GACACCCTTG-3’ en utilisant le plasmide pcDNA-S comme matrice puis insere dans le 
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plasmide pCR®2.1-TOPO (Invitrogen) pour obtenir le plasmide pTOPO-S-MV. Les deux oligonucleotides utilises con- 
tiennent des sites de restriction BsiWI et BssHII, de fagon a permettre I'insertion ulterieure dans le vecteur rougeole, 
et ont ete congus de fagon a generer une sequence de 3774 nt incluant les codons d’initiation et de terminaison, afin 
de respecter la regie des 6 qui stipule que la longueur du genome d’un virus rougeole doit etre divisible par 6 (Calain & 
Roux, 1993, J. Virol., 67 : 4822-4830 ; Schneider et al., 1997, Virology, 227 : 314-322). L'insert a ete sequence a I’aide 
d’un kit BigDye Terminator vl .1 (Applied Biosystems) et d’un sequenceur automatique ABI377. 

[0405] Afin d’exprimer une forme soluble et secretee de la S du SRAS-CoV, un plasmide contenant I’ADNc du poly¬ 
peptide Ssol correspondant a I’ectodomaine (aa 1-1193) de la S du SRAS-CoV fusionne en son extremite C-ter a la 
sequence d’une etiquette FLAG (DYKDDDDK) via un linker BspEI codant pour le dipeptide SG a ensuite ete obtenu. 
Pour cela, un fragment d'ADN a ete amplifie a I’aide des oligonucleotides 5’-CCATTTCAAC AATTTGGCCG-3’ et 5’- 
ATAGGATCC G CGCGC TCATT ATTTATCGTC GTCATCTTTA TAATC-3’ a partir du plasmide pCDNA-Ssol puis insere 
dans le plasmide pTOPO-S-MV entre les sites Sail et BamHI pour obtenir le plasmide pTOPO-S-MV-SF. La sequence 
generee est longue de 3618 nt entre les sites BsiWI et BssHII et respecte la regie des 6. L’insert a ete sequence comme 
indique ci-dessus. 

[0406] Les fragments BsiWI -BssHI I contenant les ADNc de la proteine S et du polypeptide Ssol ont ensuite ete excises 
par digestion des plasmides pTOPO-S-MV et pTOPO-S-MV-SF puis sous-clones entre les sites correspondants du 
plasmide pTM-MVSchw-ATU2 pour donner les plasmides pTM-MVSchw2-SARS-S et pTM-MVSchw2-SARS-Ssol (fi¬ 
gure 40B). Ces deux plasmides ont ete deposes a la C.N.C.M. le 1 er decembre 2004, sous les numeros 1-3326 et I- 
3327, respectivement. 

[0407] Les virus rougeole recombinants correspondants aux plasmides pTM-MVSchw2-SARS-S et pTM-MVSchw2- 
SARS-Ssol ont ete obtenus par genetique inverse selon le systeme reposant sur I’utilisation d’une lignee cellulaire 
auxiliaire, decrit par Radecke et coll. (1995, Embo J., 14, : 5773-5784) et modifie par Parks et coll. (1999, J. Virol., 73 : 
3560-3566). Brievement, les cellules auxiliaires 293-3-46 sont transferees selon la methode au phosphate de calcium 
par 5 p,g des plasmides pTM-MVSchw2-SARS-S ou pTM-MVSchw2-SARS-Ssol et 0,02 p,g du plasmide pEMC-La 
dirigeant I’expression de la polymerase L du MV (don de M.A. Billeter). Apres une nuit d’incubation a 37°C, un choc 
thermique est realise pendant 2 heures a 43°C et les cellules transferees sont transferees sur une monocouche de 
cellules Vero. Pour chacun des deux plasmides, des syncytia sont apparus apres 2 a 3 jours de co-culture et ont ete 
transferes successivement sur des monocouches de cellules Vero a 70% de confluence en boites de petri de 35 mm 
puis en flacons de 25 et 75 cm 2 . Quand les syncytia ont atteint 80-90% de confluence, les cellules sont recuperees a 
I’aide d’un grattoir puis congelees et decongelees une fois. Apres une centrifugation a basse vitesse, le surnageant 
contenant le virus est conserve en aliquot a -80°C. Les titres des virus recombinants MVSchw2-SARS-S et MVSchw2- 
SARS-Ssol ont ete determines par dilution limite sur cellules Vero et le titre en dose infectant 50% des cupules (TCID 50 ) 
calcule selon la methode de Karber. 

3) Caracterisation des virus recombinants 

[0408] L’expression des transgenes codant la proteine S et le polypeptide Ssol a ete recherchee par western blot et 
immunofluorescence. 

[0409] Des monocouches de cellules Vero en flacons T-25 ont ete infectees a une multiplicity de 0,05 par differents 
passages des deux virus MVSchw2-SARS-S et MVSchw2-SARS-Ssol et le virus sauvage MWSchw a titre de controle. 
Quand les syncytia ont atteint 80 a 90% de confluence, des extraits cytoplasmiques ont ete prepares dans un tampon 
d’extraction (150mMNaCI, 50 mM Tris-HCI pH 7,2, 1% triton-X-100, 0,1% SDS, 1% DOC) puis dilues en tampon de 
depot selon Laemmli, separes sur un gel SDS a 8% de polyacrylamide et transferes sur une membrane de PVDF 
(BioRad). La detection de cette immunoempreinte (« western blot») a ete realisee a I’aide d'un serum polyclonal de lapin 
anti-S (immun-serum du lapin P11135 : cf exemple 4 ci-dessus) et d’anticorps polyclonaux d’ane diriges contre les IgG 
de lapin et couples a la peroxidase (NA934V, Amersham). Les anticorps fixes ont ete reveles par luminescence a I’aide 
du kit ECL+ (Amersham) et de films d'autoradiographie Hyperfilm MP (Amersham). 

[0410] Des cellules Vero en monocouches sur lamellesde verre ont ete infectees par les deux virus MVSchw2-SARS- 
S et MVSchw2-SARS-Ssol et le virus sauvage MWSchw a titre de controle a des multiplicites d’infection de 0,05. Quand 
les syncytia ont atteint 90 a 100% (virus MVSchw2-SARS-Ssol) ou 30 a 40% (MVSchw2-SARS-S,MWSchw) de con¬ 
fluence, les cellules ont ete fixees dans une solution de PBS-PFA4%, permeabilisees par une solution de PBS contenant 
0,2% de triton puis marquees par des anticorps polyclonaux de lapins hyperimmunises par des virions purifies et inactives 
du SRAS-CoV et par un conjugue d’anticorps de chevre anti-lgG(H+L) de lapin couple au FITC (Jackson). 

[0411] Comme le montrent les figures 41 et 42, les virus recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol 
dirigent I’expression de la proteine S et du polypeptide Ssol respectivement a des niveaux comparables a ceux que I’on 
peut observer 8h apres infection par le SRAS-CoV. L’expression de ces polypeptides est stable apres 3 passages des 
virus recombinants en culture cellulaire. Ces resultats demontrent que les virus rougeole recombinants sont bien porteurs 
des transgenes et permettent I’expression de la glycoproteine du SRAS sous sa forme membranaire (S) ou sous une 
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forme soluble (Ssol). On s’attend a ce que le polypeptide Ssol soit secrete des cellules infectees par le virus MVSchw2- 
SARS-Ssol comme c’est le cas lorsque ce meme polypeptide est exprime dans des cellules de mammiferes apres 
transfection transitoire des sequences correspondantes (cf exemple 11 ci-dessus). 

4) Applications 

[0412] Ayant montre que les virus MVSchw2-SARS-S et MVSchw2-SARS-Ssol permettent I'expression de la S du 
SRAS-CoV, leur capacite a induire une reponse immunitaire protectrice contre le SRAS-CoV chez la souris CD46 +/_ 
IFN-aPR^", qui est susceptible a I'infection par le MV, est evaluee. La reponse en anticorps des souris immunisees est 
evaluee par test ELISA contre les antigenes natifs du SRAS-CoV et pour leur capacite a neutraliser I’infectivite du SRAS- 
CoV in vitro, en utilisant les methodologies decrites ci-dessus. Le pouvoir protecteur de la reponse sera evalue en 
mesurant la reduction de la charge virale pulmonaire 2 jours apres une infection d’epreuve non letale par le SRAS-CoV. 
[0413] Des virus rougeole recombinants de seconde generation sont construits en substituant les sequences sauvages 
des genes S et Sol par des genes synthetiques optimises pour I’expression en cellules de mammiferes, decrits a I’exemple 
15 ci-dessus. Ces virus rougeole recombinants sont susceptibles d’exprimer des quantites plus importantes des anti¬ 
genes S et Ssol et done de presenter une immunogenicite accrue. 

[0414] Alternativement, les genes sauvages ou synthetiques codant pour la proteine S ou le polypeptide Ssol peuvent 
etre inseres dans le vecteur rougeole MVSchw-ATU3 sous la forme d’une unite de transcription supplemental localisee 
entre les genes H et L, puis les virus recombinants produits et caracterises de fagon similaire. Cette insertion est 
susceptible de generer des virus recombinants possedant des caracteristiques (multiplication du virus, niveau depres¬ 
sion du transgene) differentes et possiblement une immunogenicite amelioree par rapport a ceux obtenus apres insertion 
des transgenes entre les genes P et N. 

[0415] Le virus rougeole recombinant MVSchw2-SARS-Ssol peut etre utilise pour la production en quantite et la 
purification de I'antigene Ssol en vue d’applications diagnostiques et vaccinales. 

Exemple 18 : Autres applications liees a la proteine S 

[0416] 

a) Les vecteurs lentiviraux permettant I’expression de la S ou de Ssol (voire de fragments de la S) peuvent constituer 
un vaccin recombinant contre le SRAS-CoV, pour etre utilise en prophylaxie humaine et veterinaire. Afin de demontrer 
la faisabilite d’un tel vaccin, I’immunogenicite des vecteurs lentiviraux recombinants TRIP-SD/SA-S-WPRE et TRIP- 
SD/SA-Ssol-WPRE est etudiee chez la souris. 

b) Des anticorps monoclonaux sont produits a I’aide du polypeptide recombinant Ssol. D’apres les resultats presentes 
a I’exemple 14 ci-dessus, ces anticorps ou du moins la majorite d’entre eux reconnaTtront la forme native de la S 
du SRAS-CoV et seront susceptibles d'applications diagnostiques et/ou prophylactiques. 

c) Un test de serologie du SRAS est mis au point avec le polypeptide Ssol utilise comme antigene et la methodologie 
du double epitope. 
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atattaggtt tttacctacc 
ctctaaacga actttaaaat 
gcagtataaa caataataaa 
tctgcagact gcttacggtt 
gtccgggtgt gaccgaaagg 
cacgtccaac tcagtttgcc 
gactctgtgg aagaggccct 
ctagtagagc tggaaaaagg 
cgttctgatg ccttaagcac 
gacggcattc agtacggtcg 
gaaaccccaa ttgcataccg 
ggtcatagct atggcatcga 
cccattgaag attatgaaca 
ctcactcgtg agctcaatgg 
ccagatgggt accctcttga 
tgcactcttt ccgaacaact 
gaccatgagc atgaaattgc 
acacccttcg aaattaagag 
tttgtgtttc ctcttaactc 
actgagggtt tcatggggcg 
aacaatatgc acttgtctac 
acgtgcgact ttctgaaagc 
ggacctacta catgtgggta 
tgtcaagacc cagagattgg 
attgaaactc gactccgcaa 
tatgttggct gctataataa 
tcaggccata ctggcattac 


caggaaaagc caaccaacct 
ctgtgtagct gtcgctcggc 
ttttactgtc gttgacaaga 
tcgtccgtgt tgcagtcgat 
taagatggag agccttgttc 
tgtccttcag gttagagacg 
atcggaggca cgtgaacacc 
cgtactgccc cagcttgaac 
caatcacggc cacaaggtcg 
tagcggtata acactgggag 
caatgttctt cttcgtaaga 
tctaaagtct tatgacttag 
aaactggaac actaagcatg 
aggtgcagtc actcgctatg 
ttgcatcaaa gattttctcg 
tgattacatc gagtcgaaga 
ctggttcact gagcgctctg 
tgccaagaaa tttgacactt 
aaaagtcaaa gtcattcaac 
tatacgctct gtgtaccctg 
cttgatgaaa tgtaatcatt 
cacttgtgaa cattgtggca 
cctacctact aatgctgtag 
acctgagcat agtgttgcag 
gggaggtagg actagatgtt 
gcgtgcctac tgggttcctc 
tggtgacaat gtggagacct 


cgatctcttg tagatctgtt 
tgcatgccta gtgcacctac 
aacgagtaac tcgtccctct 
catcagcata cctaggtttc 
ttggtgtcaa cgagaaaaca 
tgctagtgcg tggcttcggg 
tcaaaaatgg cacttgtggt 
agccctatgt gttcattaaa 
ttgagctggt tgcagaaatg 
tactcgtgcc acatgtgggc 
acggtaataa gggagccggt 
gtgacgagct tggcactgat 
gcagtggtgc actccgtgaa 
tcgacaacaa tttctgtggc 
cacgcgcggg caagtcaatg 
gaggtgtcta ctgctgccgt 
ataagagcta cgagcaccag 
tcaaagggga atgcccaaag 
cacgtgttga aaagaaaaag 
ttgcatctcc acaggagtgt 
gcgatgaagt ttcatggcag 
ctgaaaattt agttattgaa 
tgaaaatgcc atgtcctgcc 
attatcacaa ccactcaaac 
ttggaggctg tgtgtttgcc 
gtgctagtgc tgatattggc 
tgaatgagga tctccttgag 
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atactgagtc gtgaacgtgt 
gttgccatca ttttggcatc 
agtcttgatt acaagtcttt 
aagggaaagc ccgtaaaagg 
ctgtgtggtt ttccctcaca 
gatgcagcaa accactcaat 
atttctgaac agtcattacg 
aacagtgtca ttattatggc 
ttgtctaatc ttttgggcac 
gcgaaactta gtgcaggagt 
attacaggtg tttttgacat 
gattgtgtaa aatgcttcat 
gtcactatcg ctggcgcaaa 
agcaagggac tttaccgtca 
cttaaggcac caaaagaagt 
tctgaggagg ttgttctcaa 
ttcacaaatg gagctatcgt 
attaaggaca aagaacaata 
tttcgcttaa aagggggtgc 
gaagttcaag gttacaagaa 
gtgcttaatg aaaagtgctc 
gcatgtgttg tagcagaggc 
aacatgggta ttgatcttga 
ggtgaagaaa acttttcatc 
gaggacgatg cagagtgtga 
acagaggatg attatcaagg 
gttgaggaag aagaagagga 
ccagaaccag aacctacacc 
actgacaatg ttgccattaa 
atggtgattg taaatgctgc 
ctcaacaagg caaccaatgg 
ggccctctta cagtaggagg 
ctgcatgttg ttggacctaa 
tatgaaaatt tcaattcaca 


taacattaac attgttggcg 
tttctctgct tctacaagtg 
caaaaccatt gttgagtcct 
tgcttggaac attggacaac 
ggctgctggt gttatcagat 
tcctgatttg caaagagcag 
tcttgtcgac gccatggttt 
atatgtaact ggtggtcttg 
tactgttgaa aaactcaggc 
tgaatttctc aaggatgctt 
cgtcaagggt caaatacagg 
tgatgttgtt aacaaggcac 
gttgcgatca ctcaacttag 
gtgtatacgt ggcaaggagc 
aacctttctt gaaggtgatt 
gaacggtgaa ctcgaagcac 
tggcacacca gtctgtgtaa 
ctgcgcattg tctcctggtt 
accaattaaa ggtgtaacct 
tgtgagaatc acatttgagc 
tgtctacact gttgaatccg 
tgttgtgaag actttacaac 
tgagtggagt gtagctacat 
acgtatgtat tgttcctttt 
ggaagaagaa attgatgaaa 
tctccctctg gaatttggtg 
agactggctg gatgatacta 
tgaagaacca gttaatcagt 
atgtgttgac atcgttaagg 
taacatacac ctgaaacatg 
tgccatgcaa aaggagagtg 
gtcttgtttg ctttctggac 
cctaaatgca ggtgaggaca 
ggacatctta cttgcaccat 


attttcattt gaatgaagag 
cctttattga cactataaag 
gcggtaacta taaagttacc 
agagatcagt tttaacacca 
caatttttgc gcgcacactt 
ctgtcaccat acttgatggt 
atacttcaga cctgctcacc 
tacaacagac ttctcagtgg 
ctatctttga atggattgag 
gggagattct caaatttctc 
ttgcttcaga taacatcaag 
tcgaaatgtg cattgatcaa 
gtgaagtctt catcgctcaa 
agctgcaact actcatgcct 
cacatgacac agtacttacc 
tcgagacgcc cgttgatagc 
atggcctcat gctcttagag 
tactggctac aaacaatgtc 
ttggagaaga tactgtttgg 
ttgatgaacg tgttgacaaa 
gtaccgaagt tactgagttt 
cagtttctga tctccttacc 
tctacttatt tgatgatgct 
accctccaga tgaggaagaa 
cctgtgaaca tgagtacggt 
cctcagctga aacagttcga 
ctgagcaatc agagattgag 
ttactggtta tttaaaactt 
aggcacaaag tgctaatcct 
gtggtggtgt agcaggtgca 
atgattacat taagctaaat 
ataatcttgc taagaagtgt 
tccagcttct taaggcagca 
tgttgtcagc aggcatattt 
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ggtgctaaac cacttcagtc 
attgcagtca atgacaaagc 
aagcctagag tggaagcacc 
gaggagaaat ctgtcgtaca 
gatgaggtta ccacaacact 
gctgatatca atggtaagct 
tctttccttg agaaggatgc 
acttgtgttg taataccctc 
ttgaagaaag tgccagttga 
tatacacttg aggaagctaa 
ccttcagaag cacctaatgc 
gaaatgcttg ctcatgctga 
gccataatgg caaccatcca 
gactatggtg tccgattctt 
aagctgaact ctctaaatga 
tttaatcttg aagaggctgc 
gtatcatcac cagatgctgt 
tctgaggagc actttgtaga 
tcaggacagc gtacagagtt 
cacactctgg agagccccgt 
ctaaagagtc tcttatccct 
aacactaatc tccacacaca 
ccaacatact tggatggtgc 
aagactttct ttgtactacc 
catactcttg atgagagttt 
tggaaatttc ctcaagttgg 
ttgtctagtg ttttattagc 
caagaggctt attatagagc 
gcttacagta ataaaactgt 
ctacagcatg ctaatttgga 
ggtcagaaaa ctactacctt 
tatgataatc ttaagacagg 
tatctagtac aacaagagtc 
ttacagcaag gtacattctt 


tttacaagtg tgcgtgcaga 
tctttatgag caggttgtca 
taaacaagag gagccaccaa 
gaagcctgtc gatgtgaagc 
ggaagaaact aagtttctta 
ttaccatgat tctcagaaca 
accttacatg gtaggtgatg 
caaaaaggct ggtggcacta 
tgagtatata accacgtacc 
gactgctctt aagaaatgca 
taaggaagag attctaggaa 
agagacaaga aaattaatgc 
acgtaagtat aaaggaatta 
cttttatact agtaaagagc 
gccgcttgtc acaatgccaa 
gcgctgtatg cgttctctta 
tactacatat aatggatacc 
aacagtttct ttggctggct 
aggtgttgaa tttcttaagc 
cgagtttcat cttgacggtg 
gcgggaggtt aagactataa 
gcttgtggat atgtctatga 
tgatgttaca aaaattaaac 
tagtgatgac acactacgta 
tcttggtagg tacatgtctg 
tggtttaact tcaattaaat 
acttcaacag cttgaagtca 
ccgtgctggt gatgctgcta 
tggcgagctt ggtgatgtca 
atctgcaaag cgagttctta 
aacgggtgta gaagctgtga 
tgtttccatt ccatgtgtgt 
ttcttttgtt atgatgtctg 
atgtgcgaat gagtacactg 


cggttcgtac acaggtttat 
tggattatct tgataacctg 
acacagaaga ttccaaaact 
caaaaattaa ggcctgcatt 
ccaataagtt actcttgttt 
tgcttagagg tgaagatatg 
ttatcactag tggtgatatc 
ctgagatgct ctcaagagct 
ctggacaagg atgtgctggt 
aatctgcatt ttatgtacta 
ctgtatcctg gaatttgaga 
ctatatgcat ggatgttaga 
aaattcaaga gggcatcgtt 
ctgtagcttc tattattacg 
ttggttatgt gacacatggt 
aagctcctgc cgtagtgtca 
tcacttcgtc atcaaagaca 
cttacagaga ttggtcctat 
gtggtgacaa aattgtgtac 
aggttctttc acttgacaaa 
aagtgttcac aactgtggac 
catatggaca gcagtttggt 
ctcatgtaaa tcatgagggt 
gtgaagcttt cgagtactac 
ctttaaacca cacaaagaaa 
gggctgataa caattgttat 
aattcaatgc accagcactt 
acttttgtgc actcatactc 
gagaaactat gacccatctt 
atgtggtgtg taaacattgt 
tgtatatggg tactctatct 
gtggtcgtga tgctacacaa 
caccacctgc tgagtataaa 
gtaactatca gtgtggtcat 
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tacactcata 

taactgctaa 

ggagaccctc 

tatcgtattg 

acggagctca 

ccttacaaag 

5760 

atgtcagagt 

acaaaggacc 

agtgactgat 

gttttctaca 

aggaaacatc 

ttacactaca 

5820 

accatcaagc 

ctgtgtcgta 

taaactcgat 

ggagttactt 

acacagagat 

tgaaccaaaa 

5880 

ttggatgggt 

attataaaaa 

ggataatgct 

tactatacag 

agcagcctat 

agaccttgta 

5940 

ccaactcaac 

cattaccaaa 

tgcgagtttt 

gataatttca 

aactcacatg 

ttctaacaca 

6000 

aaatttgctg 

atgatttaaa 

tcaaatgaca 

ggcttcacaa 

agccagcttc 

acgagagcta 

6060 

tctgtcacat 

tcttcccaga 

cttgaatggc 

gatgtagtgg 

ctattgacta 

tagacactat 

6120 

tcagcgagtt 

tcaagaaagg 

tgctaaatta 

ctgcataagc 

caattgtttg 

gcacattaac 

6180 

caggctacaa 

ccaagacaac 

gttcaaacca 

aacacttggt 

gtttacgttg 

tctttggagt 

6240 

acaaagccag 

tagatacttc 

aaattcattt 

gaagttctgg 

cagtagaaga 

cacacaagga 

6300 

atggacaatc 

ttgcttgtga 

aagtcaacaa 

cccacctctg 

aagaagtagt 

ggaaaatcct 

6360 

accatacaga 

aggaagtcat 

agagtgtgac 

gtgaaaacta 

ccgaagttgt 

aggcaatgtc 

6420 

atacttaaac 

catcagatga 

aggtgttaaa 

gtaacacaag 

agttaggtca 

tgaggatctt 

6480 

atggctgctt 

atgtggaaaa 

cacaagcatt 

accattaaga 

aacctaatga 

gctttcacta 

6540 

gccttaggtt 

taaaaacaat 

tgccactcat 

ggtattgctg 

caattaatag 

tgttccttgg 

6600 

agtaaaattt 

tggcttatgt 

caaaccattc 

ttaggacaag 

cagcaattac 

aacatcaaat 

6660 

tgcgctaaga 

gattagcaca 

acgtgtgttt 

aacaattata 

tgccttatgt 

gtttacatta 

6720 

ttgttccaat 

tgtgtacttt 

tactaaaagt 

accaattcta 

gaattagagc 

ttcactacct 

6780 

acaactattg 

ctaaaaatag 

tgttaagagt 

gttgctaaat 

tatgtttgga 

tgccggcatt 

6840 

aattatgtga 

agtcacccaa 

attttctaaa 

ttgttcacaa 

tcgctatgtg 

gctattgttg 

6900 

ttaagtattt 

gcttaggttc 

tctaatctgt 

gtaactgctg 

cttttggtgt 

actcttatct 

6960 

aattttggtg 

ctccttctta 

ttgtaatggc 

gttagagaat 

tgtatcttaa 

ttcgtctaac 

7020 

gttactacta 

tggatttctg 

tgaaggttct 

tttccttgca 

gcatttgttt 

aagtggatta 

7080 

gactcccttg 

attcttatcc 

agctcttgaa 

accattcagg 

tgacgatttc 

atcgtacaag 

7140 

ctagacttga 

caattttagg 

tctggccgct 

gagtgggttt 

tggcatatat 

gttgttcaca 

7200 

aaattctttt 

atttattagg 

tctttcagct 

ataatgcagg 

tgttctttgg 

ctattttgct 

7260 

agtcatttca 

tcagcaattc 

ttggctcatg 

tggtttatca 

ttagtattgt 

acaaatggca 

7320 

cccgtttctg 

caatggttag 

gatgtacatc 

ttctttgctt 

ctttctacta 

catatggaag 

7380 

agctatgttc 

atatcatgga 

tggttgcacc 

tcttcgactt 

gcatgatgtg 

ctataagcgc 

7440 

aatcgtgcca 

cacgcgttga 

gtgtacaact 

attgttaatg 

gcatgaagag 

atctttctat 

7500 

gtctatgcaa 

atggaggccg 

tggcttctgc 

aagactcaca 

attggaattg 

tctcaattgt 

7560 

gacacatttt 

gcactggtag 

tacattcatt 

agtgatgaag 

ttgctcgtga 

tttgtcactc 

7620 

cagtttaaaa 

gaccaatcaa 

ccctactgac 

cagtcatcgt 

atattgttga 

tagtgttgct 

7680 

gtgaaaaatg 

gcgcgcttca 

cctctacttt 

gacaaggctg 

gtcaaaagac 

ctatgagaga 

7740 
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7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 

9180 

9240 

9300 

9360 

9420 
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9540 

9600 

9660 

9720 

9780 
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catccgctct cccattttgt 
ctgcctatta atgtcatagt 
tctgcttctg tgtactacag 
cttgtatcag acgttggaga 
gacacctttt cagcaacttt 
gctcacagcg agttagcaaa 
gctgcccgac aaggtgttgt 
aaactttcac atcactctga 
acctataata aggttgaaaa 
gcaaggcata tcaatgccca 
aaagactaca tgtctttatc 
aacaacatac cttttagact 
actaaaatct cactcaaggg 
gccacattat tgtgcgttct 
ttgtcaatcc atgatggtta 
gtcactcgtg acatcatttc 
gcatggttta gccagcgtgg 
gctatcatta caagagagat 
gcaatcaatg gtgacttctt 
tgctacacac cttccaaact 
gctgctgagt gtacaatttt 
actaatttgc tagagggttc 
cttatggatg gttccatcat 
gtaacaactt ttgatgctga 
atttgcctat ctaccagtgg 
ggagttttct gtggtgttga 
caacctgtgg gtgctttaga 
ttggtgactt gtgctgccta 
catgttgttg ctgctaatgc 
ccagcttaca gctttctgcc 
ttcaccaatg atgtttcatt 
gtgccttttt ggataacagc 
ttctttaaca actatcttag 
gaggaggctg ctttgtgtac 


caatttagac aatttgagag 
ttttgatggc aagtccaaat 
tcagctgatg tgccaaccta 
tagtactgaa gtttccgtta 
tagtgttcct atggaaaaac 
gggtgtagct ttagatggtg 
tgataccgat gttgacacaa 
cttagaagtg acaggtgaca 
catgacgccc agagatcttg 
agtagcaaaa agtcacaatg 
tgaacagctg cgtaaacaaa 
aacttgtgct acaactagac 
tggtaagatt gttagtactt 
tgctgcattg gtttgttata 
cacaaatgaa atcattggtt 
tactgatgat tgttttgcaa 
tggttcatac aaaaatgaca 
tggtttcata gtgcctggct 
gcattttcta cctcgtgttt 
cattgagtat agtgattttg 
taaggatgct atgggcaaac 
tatttcttat agtgagcttc 
acagtttcct aacacttacc 
gtactgtaga catggtacat 
tagatgggtt cttaataatg 
tgcgatgaat ctcatagcta 
tgtgtctgct tcagtagtgg 
ctactttatg aaattcagac 
acttttgttt ttgatgtctt 
gggagtctac tcagtctttt 
cttggctcac cttcaatggt 
aatctatgta ttctgtattt 
gaaaagagtc atgtttaatg 
ctttttgctc aacaaggaaa 


ctaacaacac taaaggttca 
gcgacgagtc tgcttctaag 
ttctgttgct tgaccaagct 
agatgtttga tgcttatgtc 
ttaaggcact tgttgctaca 
tcctttctac attcgtgtca 
aggatgttat tgaatgtctc 
gttgtaacaa tttcatgctc 
gcgcatgtat tgactgtaat 
tttcactcat ctggaatgta 
ttcgtagtgc tgccaagaag 
aggttgtcaa tgtcataact 
gttttaaact tatgcttaag 
tcgttatgcc agtacataca 
acaaagccat tcaggatggt 
ataaacatgc tggttttgac 
aaagctgccc tgtagtagct 
taccgggtac tgtgctgaga 
ttagtgctgt tggcaacatt 
ctacctctgc ttgcgttctt 
ctgtgccata ttgttatgac 
gtccagacac tcgttatgtg 
tggagggttc tgttagagta 
gcgaaaggtc agaagtaggt 
agcattacag agctctatca 
acatctttac tcctcttgtg 
ctggtggtat tattgccata 
gtgtttttgg tgagtacaac 
tcactatact ctgtctggta 
acttgtactt gacattctat 
ttgccatgtt ttctcctatt 
ctctgaagca ctgccattgg 
gagttacatt tagtaccttc 
tgtacctaaa attgcgtagc 
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9840 

9900 
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10020 

10080 
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10440 

10500 
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10620 

10680 
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10800 

10860 

10920 
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11160 
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11400 

11460 

11520 

11580 

11640 

11700 

11760 

11820 
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gagacactgt 

tatttcagtg 

aaggctctaa 

tcaatcactt 

gttgaagggt 

gatgacacag 

aactatgaag 

gttcaacttc 

acttctaacc 

tcagttctag 

aatcatacca 

gattatgatt 

gctggtactg 

gctgcaggta 

atcaatggtg 

gtggcaatga 

ctttctgctc 

cagaatggta 

ccatttgatg 

gttaagggca 

caaagtacac 

cttggtatta 

ttgtgcttgt 

cctgctagct 

ggttataggc 

acagctcgca 

acacttgttt 

ttagttattt 

agagctatag 

ttacagtgta 

cttttctgtt 

tctacacaag 

gatgctttca 

gctactgtac 


tgccacttac 

gagccttaga 

atgactttag 

ctgctgttct 

gcatggtaca 

tatactgtcc 

atctgctcat 

gtgttattgg 

ctaagacacc 

catgctacaa 

ttaaaggttc 

gcgtgtcttt 

acttagaagg 

cagacacaac 

ataggtggtt 

agtacaacta 

aaacaggaat 

tgaatggtcg 

ttgttagaca 

ctcatcattg 

agtggtcact 

tggcaattgc 

ttctgttacc 

gggtgatgcg 

ttaaggattg 

ctgtttatga 

acaaagtcta 

ctgtaacctc 

tgtttgtgtg 

tcatgcttgt 

tactcaaccg 

aatttaggta 

agcttaacat 

agtctaaaat 


acagtataac 

tactaccagc 

caactcaggt 

gcagagtggt 

agtaacctgt 

aagacatgtc 

tcgcaaatcc 

ccattctatg 

caagtataaa 

tggttcacca 

tttccttaat 

ctgctatatg 

taaattctat 

cataacatta 

tcttaataga 

tgaacctttg 

tgccgtctta 

tactatcctt 

atgctctggt 

gatgctttta 

gtttttcttt 

tgcatgtgct 

ttctcttgca 

tatcatgaca 

tgttatgtat 

tgatgctgct 

ctatggtaat 

taactattct 

tgttgagtat 

ttattgtttc 

ttacttcagg 

tatgaactcc 

taagttgttg 

gtctgacgta 


aggtatcttg 

tatcgtgaag 

gctgatgttc 

tttaggaaaa 

ggaactacaa 

atttgcacag 

aaccatagct 

caaaattgtc 

tttgtccgta 

tctggtgttt 

ggatcatgtg 

catcatatgg 

ggtccatttg 

aatgttttgg 

ttcaccacta 

acacaagatc 

gatatgtgtg 

ggtagcacta 

gttaccttcc 

actttcttga 

gtttacgaga 

atgctgcttg 

acagttgctt 

tggcttgaat 

gcttcagctt 

agacgtgttt 

gctttagatc 

ggtgtcgtta 

tacccattgt 

ttaggctatt 

cttactcttg 

caggggcttt 

ggtattggag 

aagtgcacat 


ctctatataa 

cagcttgctg 

tctaccaacc 

tggcattccc 

ctcttaatgg 

cagaagacat 

ttcttgttca 

tgcttaggct 

tccaacctgg 

atcagtgtgc 

gtagtgttgg 

agcttccaac 

ttgacagaca 

catggctgta 

ctttgaatga 

atgttgacat 

ctgctttgaa 

ttttagaaga 

aaggtaagtt 

catcactatt 

atgctttctt 

ttaagcataa 

actttaatat 

tggctgacac 

tagttttgct 

ggacactgat 

aagctatttc 

cgactatcat 

tatttattac 

gttgctgctg 

gtgtttatga 

tgcctcctaa 

gtaaaccatg 

ctgtggtact 


caagtacaag 

ccacttagca 

accacagaca 

gtcaggcaaa 

attgtggttg 

gcttaatcct 

ggctggcaat 

taaagttgat 

tcaaacattt 

catgagacct 

ttttaacatt 

aggagtacac 

aactgcacag 

tgctgctgtt 

ctttaacctt 

attgggacct 

agagctgctg 

tgagtttaca 

caagaaaatt 

gattcttgtt 

gccatttact 

gcacgcattc 

ggtctacatg 

tagcttgtct 

tattctcatg 

gaatgtcatt 

catgtgggcc 

gtttttagct 

tggcaacacc 

ctactttggc 

ctacttggtc 

gagtagtatt 

tatcaaggtt 

gctctcggtt 
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rttcaacaac 

ttagagtaga 

gtcatcttct 

aaattgtggg 

cacaatgtgt 

acaactccac 

11880 

aatgatattc 

ttcttgcaaa 

agacacaact 

gaagctttcg 

agaagatggt 

ttctcttttg 

11940 

tctgttttgc 

tatccatgca 

gggtgctgta 

gacattaata ggttgtgcga 

ggaaatgctc 

12000 

gataaccgtg 

ctactcttca 

ggctattgct 

tcagaattta gttctttacc 

atcatatgcc 

12060 

gcttatgcca 

ctgcccagga 

ggcctatgag 

caggctgtag 

ctaatggtga 

ttctgaagtc 

12120 

gttctcaaaa 

agttaaagaa 

atctttgaat 

gtggctaaat 

ctgagtttga 

ccgtgatgct 

12180 

gccatgcaac 

gcaagttgga 

aaagatggca 

gatcaggcta tgacccaaat 

gtacaaacag 

12240 

gcaagatctg 

aggacaagag 

ggcaaaagta 

actagtgcta tgcaaacaat 

gctcttcact 

12300 

atgcttagga 

agcttgataa 

tgatgcactt 

aacaacatta tcaacaatgc 

gcgtgatggt 

12360 

tgtgttccac 

tcaacatcat 

accattgact 

acagcagcca 

aactcatggt 

tgttgtccct 

12420 

gattatggta 

cctacaagaa 

cacttgtgat 

ggtaacacct 

ttacatatgc 

atctgcactc 

12480 

tgggaaatcc 

agcaagttgt 

tgatgcggat 

agcaagattg 

ttcaacttag 

tgaaattaac 

12540 

atggacaatt 

caccaaattt 

ggcttggcct 

cttattgtta 

cagctctaag 

agccaactca 

12600 

gctgttaaac 

tacagaataa 

tgaactgagt 

ccagtagcac 

tacgacagat 

gtcctgtgcg 

12660 

gctggtacca 

cacaaacagc 

ttgtactgat 

gacaatgcac 

ttgcctacta 

taacaattcg . 

12720 

aagggaggta 

ggtttgtgct 

ggcattacta 

tcagaccacc 

aagatctcaa 

atgggctaga 

12780 

ttccctaaga 

gtgatggtac 

aggtacaatt 

tacacagaac 

tggaaccacc 

ttgtaggttt 

12840 

gttacagaca 

caccaaaagg 

gcctaaagtg 

aaatacttgt. 

acttcatcaa 

aggcttaaac 

12900 

aacctaaata 

gaggtatggt 

gctgggcagt 

ttagctgcta 

cagtacgtct 

tcaggctgga 

12960 

aatgctacag 

aagtacctgc 

caattcaact 

gtgctttcct tctgtgcttt 

tgcagtagac 

13020 

cctgctaaag 

catataagga 

ttacctagca 

agtggaggac 

aaccaatcac 

caactgtgtg 

13080 

aagatgttgt 

gtacacacac 

tggtacagga 

caggcaatta 

ctgtaacacc 

agaagctaac 

13140 

atggaccaag 

agtcctttgg 

tggtgcttca 

tgttgtctgt 

attgtagatg 

ccacattgac 

13200 

catccaaatc 

ctaaaggatt 

ctgtgacttg 

aaaggtaagt 

acgtccaaat 

acctaccact 

13260 

tgtgctaatg 

acccagtggg 

ttttacactt 

agaaacacag 

tctgtaccgt 

ctgcggaatg 

13320 

tggaaaggtt 

atggctgtag 

ttgtgaccaa 

ctccgcgaac 

ccttgatgca 

gtctgcggat 

13380 

gcatcaacgt 

ttttaaacgg 

gtttgcggtg 

taagtgcagc 

ccgtcttaca 

ccgtgcggca 

13440 

caggcactag 

tactgatgtc 

gtctacaggg 

cttttgatat 

ttacaacgaa 

aaagttgctg 

13500 

gttttgcaaa 

gttcctaaaa 

actaattgct 

gtcgcttcca 

ggagaaggat 

gaggaaggca 

13560 

atttattaga 

ctcttacttt 

gtagttaaga 

ggcatactat 

gtctaactac 

caacatgaag 

13620 

agactattta 

taacttggtt 

aaagattgtc 

cagcggttgc tgtccatgac 

tttttcaagt 

13680 

ttagagtaga 

tggtgacatg 

gtaccacata 

tatcacgtca gcgtctaact 

aaatacacaa 

13740 

tggctgattt 

agtctatgct 

ctacgtcatt 

ttgatgaggg 

taattgtgat 

acattaaaag 

13800 

aaatactcgt 

cacatacaat 

tgctgtgatg 

atgattattt 

caataagaag 

gattggtatg 

13860 
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13920 

13980 

14040 

14100 

14160 

14220 

14280 

14340 

14400 

14460 

14520 

14580 

14640 

14700 

14760 

14820 

14880 

14940 

15000 

15060 

15120 

15180 

15240 

15300 

15360 
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15600 

15660 

15720 

15780 

15840 
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acttcgtaga gaatcctgac atcttacgcg 
aatcattatt aaagactgta caattctgcg 
tactgacatt agataatcag gatcttaatg 
aagtagcacc aggctgcgga gttcctattg 
tcctcacttt gactagggca ttggctgctg 
cacttattaa gtgggatttg ctgaaatatg 
accgttattt taaatattgg gaccagacat 
ataggtgtat ccttcattgt gcaaacttta 
caagttttgg accactagta agaaaaatat 
ctggatacca ttttcgtgag ttaggagtcg 
cgcgtctcag tttcaaggaa cttttagtgt 
ctggcaattt attgctagat aaacgcacta 
atgttgcttt tcaaactgtc aaacccggta 
tgtctaaagg tttctttaag gaaggaagtt 
aggatggcaa cgctgctatc agtgattatg 
gtgatatcag acaactccta ttcgtagttg 
atggtggctg tattaatgcc aaccaagtaa 
tcccatttaa taaatggggt aaggctagac 
aagatgcact tttcgcgtat actaagcgta 
ttaagtatgc cattagtgca aagaatagag 
gtactatgac aaatagacag tttcatcaga 
gagctactgt ggtaattgga acaagcaagt 
ctgtttacag tgatgtagaa actccacacc 
gagccatgcc taacatgctt aggataatgg 
cttgctgtaa cttatcacac cgtttctaca 
gtgagatggt catgtgtggc ggctcactat 
atgctacaac tgcttatgct aatagtgtct 
taaatgcact tctttcaact gatggtaata 
aacacaggct ctatgagtgt ctctatagaa 
agttttacgc ttacctgcgt aaacatttct 
tgtgctataa cagtaactat gcggctcaag 
cagttcttta ttatcaaaat aatgtgttca 
accttactaa aggacctcac gaattttgct 
atgattacgt gtacctgcct tacccagatc 


tatatgctaa cttaggtgag cgtgtacgcc 
atgctatgcg tgatgcaggc attgtaggcg 
ggaactggta cgatttcggt gatttcgtac 
tggattcata ttactcattg ctgatgccca 
agtcccatat ggatgctgat'ctcgcaaaac 
attttacgga agagagactt tgtctcttcg 
accatcccaa ttgtattaac tgtttggatg 
atgtgttatt ttctactgtg tttccaccta 
ttgtagatgg tgttcctttt gttgtttcaa 
tacataatca ggatgtaaac ttacatagct 
atgctgctga tccagctatg catgcagctt 
catgcttttc agtagctgca ctaacaaaca 
attttaataa agacttttat gactttgctg 
ctgttgaact aaaacacttc ttctttgctc 
actattatcg ttataatctg ccaacaatgt 
aagttgttga taaatacttt gattgttacg 
tcgttaacaa tctggataaa tcagctggtt 
tttattatga ctcaatgagt tatgaggatc 
atgtcatccc tactataact caaatgaatc 
ctcgcaccgt agctggtgtc tctatctgta 
aattattgaa gtcaatagcc gccactagag 
tttacggtgg ctggcataat atgttaaaaa 
ttatgggttg ggattatcca aaatgtgaca 
cctctcttgt tcttgctcgc aaacataaca 
ggttagctaa cgagtgtgcg caagtattaa 
atgttaaacc aggtggaaca tcatccggtg 
ttaacatttg tcaagctgtt acagccaatg 
agatagctga caagtatgtc cgcaatctac 
atagggatgt tgatcatgaa ttcgtggatg 
ccatgatgat tctttctgat gatgccgttg 
gtttagtagc tagcattaag aactttaagg 
tgtctgaggc aaaatgttgg actgagactg 
cacagcatac aatgctagtt aaacaaggag 
catcaagaat attaggcgca ggctgttttg 
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tcgatgatat 

tgtcaaaaca 

gatggtacac 

ttatgattga 

aaggttcgtg 

tcactggcta 

15960 

ttgatgctta 

cccacttaca 

aaacatccta 

atcaggagta 

tgctgatgtc 

tttcacttgt 

16020 

atttacaata 

cattagaaag 

ttacatgatg 

agcttactgg 

ccacatgttg 

gacatgtatt 

16080 

ccgtaatgct 

aactaatgat 

aacacctcac 

ggtactggga 

acctgagttt 

tatgaggcta 

16140 

tgtacacacc 

acatacagtc 

ttgcaggctg 

taggtgcttg 

tgtattgtgc 

aattcacaga 

16200 

cttcacttcg 

ttgcggtgcc 

tgtattagga 

gaccattcct 

atgttgcaag 

tgctgctatg 

16260 

accatgtcat 

ttcaacatca 

cacaaattag 

tgttgtctgt 

taatccctat 

gtttgcaatg 

16320 

ccccaggttg 

tgatgtcact 

gatgtgacac 

aactgtatct 

aggaggtatg 

agctattatt 

16380 

gcaagtcaca 

taagcctccc 

attagttttc 

cattatgtgc 

taatggtcag 

gtttttggtt 

16440 

tatacaaaaa 

cacatgtgta 

ggcagtgaca 

atgtcactga 

cttcaatgcg 

atagcaacat 

16500 

gtgattggac 

taatgctggc 

gattacatac 

ttgccaacac 

ttgtactgag 

agactcaagc 

16560 

ttttcgcagc 

agaaacgctc 

aaagccactg 

aggaaacatt 

taagctgtca 

tatggtattg 

16620 

ccactgtacg 

cgaagtactc 

tctgacagag 

aattgcatct 

ttcatgggag 

gttggaaaac 

16680 

ctagaccacc 

attgaacaga 

aactatgtct 

ttactggtta 

ccgtgtaact 

aaaaatagta 

16740 

aagtacagat 

tggagagtac 

acctttgaaa 

aaggtgacta 

tggtgatgct 

gttgtgtaca 

16800 

gaggtactac 

gacatacaag 

ttgaatgttg 

gtgattactt 

tgtgttgaca 

tctcacactg 

16860 

taatgccact 

tagtgcacct 

actctagtgc 

cacaagagca 

ctatgtgaga 

attactggct 

16920 

tgtacccaac 

actcaacatc 

tcagatgagt 

tttctagcaa 

tgttgcaaat 

tatcaaaagg 

16980 

tcggcatgca 

aaagtactct 

acactccaag 

gaccacctgg 

tactggtaag 

agtcattttg 

17040 

ccatcggact 

tgctctctat 

tacccatctg 

ctcgcatagt 

gtatacggca 

tgctctcatg 

17100 

cagctgttga 

tgccctatgt 

gaaaaggcat 

taaaatattt 

gcccatagat 

aaatgtagta 

17160 

gaatcatacc 

tgcgcgtgcg 

cgcgtagagt 

gttttgataa 

attcaaagtg 

aattcaacac 

17220 

tagaacagta 

tgttttctgc 

actgtaaatg 

cattgccaga 

aacaactgct 

gacattgtag 

17280 

tctttgatga 

aatctctatg 

gctactaatt 

atgacttgag 

tgttgtcaat 

gctagacttc 

17340 

gtgcaaaaca 

ctacgtctat 

attggcgatc 

ctgctcaatt 

accagccccc 

cgcacattgc 

17400 

tgactaaagg 

cacactagaa 

ccagaatatt 

ttaattcagt 

gtgcagactt 

atgaaaacaa 

17460 

taggtccaga 

catgttcctt 

ggaacttgtc 

gccgttgtcc 

tgctgaaatt 

gttgacactg 

17520 

tgagtgcttt 

agtttatgac 

aataagctaa 

aagcacacaa 

ggataagtca 

gctcaatgct 

17580 

tcaaaatgtt 

ctacaaaggt 

gttattacac 

atgatgtttc 

atctgcaatc 

aacagacctc 

17640 

aaataggcgt 

tgtaagagaa 

tttcttacac 

gcaatcctgc 

ttggagaaaa 

gctgttttta 

17700 

tctcacctta 

taattcacag 

aacgctgtag 

cttcaaaaat 

cttaggattg 

cctacgcaga 

17760 

ctgttgattc 

atcacagggt 

tctgaatatg 

actatgtcat 

attcacacaa 

actactgaaa 

17820 

cagcacactc 

ttgtaatgtc 

aaccgcttca 

atgtggctat 

cacaagggca 

aaaattggca 

17880 

ttttgtgcat 

aatgtctgat 

agagatcttt 

atgacaaact 

gcaatttaca 

agtctagaaa 

17940 
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18000 

18060 

18120 

18180 

18240 

18300 

18360 

18420 

18480 

18540 

18600 

18660 

18720 

18780 

18840 

18900 

18960 

19020 

19080 

19140 

19200 

19260 

19320 

19380 

19440 

19500 

19560 

19620 

19680 

19740 

19800 

19860 

19920 

19980 
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taccacgtcg 

gtagtaagat 

taaagttcaa 

accgtagact 

atatgtttat 

tagagggctg 

tttctacagg 

cagaattcac 

cactcatgta 

gtgatacact 

agcttacatc 

acaaacgtgc 

tgggttttga 

gtaaccttca 

gttgtgatgc 

attggtctgt 

aagtacaaca 

acattggaaa 

acgatgctca 

ctacacatca 

gttacccagc 

taccaggctg 

tcgataaaag 

cttgtgagtc 

ctacgtgtat 

accgacagta 

acaaacaatt 

atgtggctta 

tttccatcat 

aaaataagac 

aaccagtgcc 

taatctggga 

tgactgacat 

atggtagagt 


caatgtggct 

cattactggt 

gactgaagga 

catctctatg 

cacccgcgaa 

tcatgcaact 

tgttaactta 

cagagttaat 

taaaggcttg 

gaaaggattg 

aatgaagtac 

aacttgcttt 

ctatgtctat 

gagtaaccat 

tatcatgact 

tgaataccct 

catggttgtg 

tccaaaggct 

gccatgtagt 

cgataaattc 

caatgcaatt 

tgatggtggt 

tgcatttact 

tcatggcaaa 

tacacgatgc 

cttggatgca 

tgatacttat 

taatgttgtt 

taataatgct 

aacacttcct 

agagattaag 

ctacaaaaga 

tgccaagaaa 

ggaaggacag 


acattacaag 

cttcatccta 

ttatgtgttg 

atgggtttca 

gaagctattc 

agagatgctg 

gtagctgtac 

gcaaaacctc 

ccctggaatg 

tcagacagag 

tttgtcaaga 

tctacttcat 

aacccattta 

gaccaacatt 

agatgtttag 

attataggag 

aagtctgcat 

atcaagtgtg 

gacaaagctt 

actgatggtg 

gtgtgtaggt 

agtttgtatg 

aatttaaagc 

caagtagtgt 

aatttaggtg 

tataatatga 

aacctgtgga 

aataaaggac 

gtttacacaa 

gttaatgttg 

atactcaata 

gaagccccag 

cctactgaga 

gtagaccttt 


cagaaaatgt 

cacaggcacc 

acataccagg 

aaatgaatta 

gtcacgttcg 

tgggtactaa 

cgactggtta 

caccaggtga 

tagtgcgtat 

tcgtgttcgt 

ttggacctga 

cagatactta 

tgattgatgt 

gccaggtaca 

cagtccatga 

atgaactgag 

tgcttgctga 

tgcctcaggc 

acaaaataga 

tttgtttgtt 

ttgacacaag 

tgaataagca 

aattgccttt 

cggatattga 

gtgctgtttg 

tgatttctgc 

atacatttac 

actttgatgg 

aggtagatgg 

catttgagct 

atttgggtgt 

cacatgtatc 

gtgcttgttc 

ttagaaacgc 


aactggactt 

tacacacctc 

cataccaaag 

ccaagtcaat 

tgcgtggatt 

cctacctctc 

tgttgacact 

ccagtttaaa 

taagatagta 

cctttgggcg 

aagaacgtgt 

tgcctgctgg 

tcagcagtgg 

tggaaatgca 

gtgctttgtt 

ggttaattct 

taagtttcca 

tgaagtagaa 

ggaactcttc 

ttggaattgt 

agtcttgtca 

tgcattccac 

cttttactat 

ttatgttcca 

cagacaccat 

tggatttagc 

caggttacag 

acacgccggc 

tattgatgtg 

ttgggctaag 

tgatatcgct 

tacaataggt 

ttcacttact 

ccgtaatggt 


tttaaggact 

agcgttgata 

gacatgacct 

ggttacccta 

ggctttgatg 

cagctaggat 

gaaaataaca 

catcttatac 

caaatgctca 

catggctttg 

tgtctgtgtg 

aatcattctg 

ggctttacgg 

catgtggcta 

aagcgcgttg 

gcttgcagaa 

gttcttcatg 

tggaagttct 

tattcttatg 

aacgttgatc 

aacttgaact 

actccagctt 

tctgatagtc 

ctcaaatctg 

gcaaatgagt 

ctatggattt 

agtttagaaa 

gaagcacctg 

gagatctttg 

cgtaacatta 

gctaatactg 

gtctgcacaa 

gtcttgtttg 

gttttaataa 


76 


5 

10 

15 

20 

25 

30 

35 

40 

45 

50 

55 


20040 

20100 

20160 

20220 

20280 

20340 

20400 

20460 

20520 

20580 

20640 

20700 

20760 

20820 

20880 

20940 

21000 

21060 

21120 

21180 

21240 

21300 

21360 

21420 

21480 

21540 

21600 

21660 

21720 

21780 

21840 

21900 

21960 

22020 


cagaaggttc agtcaaaggt 
gagtcacatt aattggagaa 
gcattattca acagttgcct 
agcccagatc acaaatggaa 
gatataagct cgagggctat 
aacttggcgg tcttcattta 
aattagagga ttttatccct 
aaacaggttc atcaaaatgt 
agataataaa gtcacaagat 
atgctgaaat ttcattcatg 
aactacaagc aagtcaagcg 
aaagaatgct tcttgaaaag 
aaggaataat gatgaatgtc 
ctttagctgt accctacaac 
ttgcaccagg tacagctgtg 
cagatcttaa tgacttcgtc 
tacatacggc taataaatgg 
atgtgacaaa agagaatgac 
agcaaaaact agccctgggt 
ctgaccttta caagcttatg 
atgcatcatc atcggaagca 
aaattgatgg ctataccatg 
agttgtcttc ctattcactc 
ctgtaatgtc tcttaaggag 
gtaggcttat cattagagaa 
actaaacgaa catgtttatt 
accggtgcac cacttttgat 
tgaggggggt ttactatcct 
atttatttct tccattttat 
gcaaccctgt catacctttt 
ttgtccgtgg ttgggttttt 
ttaacaattc tactaatgtt 
tctttgctgt ttctaaaccc 
ttaattgcac tttcgagtac 
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ctaacacctt caaagggacc 
tcagtaaaaa cacagtttaa 
gaaacctact ttactcagag 
actgactttc tcgagctcgc 
gccttcgaac acatcgttta 
atgataggct tagccaagcg 
atggacagca cagtgaaaaa 
gtgtgttctg tgattgatct 
ttgtcagtga tttcaaaagt 
ctttggtgta aggatggaca 
tggcaaccag gtgttgcgat 
tgtgaccttc agaattatgg 
gcaaagtata ctcaactgtg 
atgagagtta ttcactttgg 
ctcagacaat ggttgccaac 
tccgacgcag attctacttt 
gaccttatta ttagcgatat 
tctaaagaag ggtttttcac 
ggttctatag ctgtaaagat 
ggccatttct catggtggac 
tttttaattg gggctaacta 
catgctaact acattttctg 
tttgacatga gcaaatttcc 
aatcaaatca atgatatgat 
aacaacagag ttgtggtttc 
ttcttattat ttcttactct 
gatgttcaag ctcctaatta 
gatgaaattt ttagatcaga 
tctaatgtta cagggtttca 
aaggatggta tttattttgc 
ggttctacca tgaacaacaa 
gttatacgag catgtaactt 
atgggtacac agacacatac 
atatctgatg ccttttcgct 


agcacaagct agcgtcaatg 
ctactttaag aaagtagacg 
cagagactta gaggatttta 
tatggatgaa ttcatacagc 
tggagatttc agtcatggac 
ctcacaagat tcaccactta 
ttacttcata acagatgcgc 
tttacttgat gactttgtcg 
ggtcaaggtt acaattgact 
tgttgaaacc ttctacccaa 
gcctaacttg tacaagatgc 
tgaaaatgct gttataccaa 
tcaatactta aatacactta 
tgctggctct gataaaggag 
tggcacacta cttgtcgatt 
aattggagac tgtgcaacag 
gtatgaccct aggaccaaac 
ttatctgtgt ggatttataa 
aacagagcat tcttggaatg 
agcttttgtt acaaatgtaa 
tcttggcaag ccgaaggaac 
gaggaacaca aatcctatcc 
tcttaaatta agaggaactg 
ttattctctt ctggaaaaag 
aagtgatatt cttgttaaca 
cactagtggt agtgaccttg 
cactcaacat acttcatcta 
cactctttat ttaactcagg 
tactattaat catacgtttg 
tgccacagag aaatcaaatg 
gtcacagtcg gtgattatta 
tgaattgtgt gacaaccctt 
tatgatattc gataatgcat 
tgatgtttca gaaaagtcag 
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22080 

22140 

22200 

22260 

22320 

22380 

22440 

22500 

22560 

22620 

22680 

22740 

22800 

22860 

22920 

22980 

23040 

23100 

23160 

23220 

23280 

23340 

23400 

23460 

23520 

23580 

23640 

23700 

23760 

23820 

23880 

23940 

24000 

24060 
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gtaattttaa acacttacga gagtttgtgt 
ataagggcta tcaacctata gatgtagttc 
aacctatttt taagttgcct cttggtatta 
ccttttcacc tgctcaagac atttggggca 
taaagccaac tacatttatg ctcaagtatg 
attgttctca aaatccactt gctgaactca 
aaggaattta ccagacctct aatttcaggg 
ctaatattac aaacttgtgt ccttttggag 
tctatgcatg ggagagaaaa aaaatttcta 
actcaacatt tttttcaacc tttaagtgct 
tttgcttctc caatgtctat gcagattctt 
tagcgccagg acaaactggt gttattgctg 
tgggttgtgt ccttgcttgg aatactagga 
attataaata taggtatctt agacatggca 
atgtgccttt ctcccctgat ggcaaacctt 
cattaaatga ttatggtttt tacaccacta 
tagtactttc ttttgaactt ttaaatgcac 
ctgaccttat taagaaccag tgtgtcaatt 
tgttaactcc ttcttcaaag agatttcaac 
atttcactga ttccgttcga gatcctaaaa 
cttttggggg tgtaagtgta attacacctg 
tatatcaaga tgttaactgc actgatgttt 
cagcttggcg catatattct actggaaaca 
taggagctga gcatgtcgac acttcttatg 
gtgctagtta ccatacagtt tctttattac 
atactatgtc tttaggtgct gatagttcaa 
ctactaactt ttcaattagc attactacag 
ccgtagattg taatatgtac atctgcggag 
aatatggtag cttttgcaca caactaaatc 
atcgcaacac acgtgaagtg ttcgctcaag 
aatattttgg tggttttaat ttttcacaaa 
ggtcttttat tgaggacttg ctctttaata 
agcaatatgg cgaatgccta ggtgatatta 
tcaatggact tacagtgttg ccacctctgc 


ttaaaaataa agatgggttt ctctatgttt 
gtgatctacc ttctggtttt aacactttga 
acattacaaa ttttagagcc attcttacag 
cgtcagctgc agcctatttt gttggctatt 
atgaaaatgg tacaatcaca gatgctgttg 
aatgctctgt taagagcttt gagattgaca 
ttgttccctc aggagatgtt gtgagattcc 
aggtttttaa tgctactaaa ttcccttctg 
attgtgttgc tgattactct gtgctctaca 
atggcgtttc tgccactaag ttgaatgatc 
ttgtagtcaa gggagatgat gtaagacaaa 
attataatta taaattgcca gatgatttca 
acattgatgc tacttcaact ggtaattata 
agcttaggcc ctttgagaga gacatatcta 
gcaccccacc tgctcttaat tgttattggc 
ctggcattgg ctaccaacct tacagagttg 
cggccacggt ttgtggacca aaattatcca 
ttaattttaa tggactcact ggtactggtg 
catttcaaca atttggccgt gatgtttctg 
catctgaaat attagacatt tcaccttgct 
gaacaaatgc ttcatctgaa gttgctgttc 
ctacagcaat tcatgcagat caactcacac 
atgtattcca gactcaagca ggctgtctta 
agtgcgacat tcctattgga gctggcattt 
gtagtactag ccaaaaatct attgtggctt 
ttgcttactc taataacacc attgctatac 
aagtaatgcc tgtttctatg gctaaaacct 
attctactga atgtgctaat ttgcttctcc 
gtgcactctc aggtattgct gctgaacagg 
tcaaacaaat gtacaaaacc ccaactttga 
tattacctga ccctctaaag ccaactaaga 
aggtgacact cgctgatgct ggcttcatga 
atgctagaga tctcatttgt gcgcagaagt 
tcactgatga tatgattgct gcctacactg 
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24120 

24180 

24240 

24300 

24360 

24420 

24480 

24540 

24600 

24660 

24720 

24780 

24840 

24900 

24960 

25020 

25080 

25140 

25200 

25260 

25320 

25380 

25440 

25500 

25560 

25620 

25680 

25740 

25800 

25860 

25920 

25980 

26040 

26100 
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ctgctctagt 

aaataccttt 

ttctctatga 

aagaatcact 

atgctcaagc 

gtgtgctaaa 

ggttaattac 

ctgctgaaat 

gacaatcaaa 

cagccccgca 

tcaccacagc 

ttgtgtttaa 

ttactacaga 

acacagttta 

acttcaaaaa 

ctgtcgtcaa 

aatcactcat 

atgtttggct 

gttgcatgac 

agtttgatga 

cgaacttatg 

aaaaattgac 

agcctcactc 

cgctaccaaa 

gttcatttgc 

tgcaggtatg 

caacgcatgt 

attactttat 

accatataac 

aaaactcaaa 

agactatgtc 

aattactaca 

agacccaccg 

aatggatcca 


tagtggtact 

tgctatgcaa 

gaaccaaaaa 

tacaacaaca 

attaaacaca 

tgatatcctt 

aggcagactt 

cagggcttct 

aagagttgac 

tggtgttgtc 

gccagcaatt 

tggcacttct 

caatacattt 

tgatcctctg 

tcatacatca 

cattcaaaaa 

tgaccttcaa 

cggcttcatt 

tagttgttgc 

ggatgactct 

gatttgttta 

aatgcttctc 

cctttcggat 

ataattgcgc 

aatttactgc 

gaggcgcaat 

agaattatta 

gatgccaact 

agtgtcacag 

gaagactacc 

gttgtacatg 

gacactggta 

aatgtgcaaa 

atttatgatg 


gccactgctg 

atggcatata 

caaatcgcca 

tcaactgcat 

cttgttaaac 

tcgcgacttg 

caaagccttc 

gctaatcttg 

ttttgtggaa 

ttcctacatg 

tgtcatgaag 

tggtttatta 

gtctcaggaa 

caacctgagc 

ccagatgttg 

gaaattgacc 

gaattgggaa 

gctggactaa 

agttgcctca 

gagccagttc 

tgagattttt 

ctgcaagtac 

ggcttgttat 

tcaataaaag 

tgctatttgt 

ttttgtacct 

tgagatgttg 

actttgtttg 

atacaattgt 

aaattggtgg 

gctatttcac 

ttgaaaatgc 

tacacacaat 

agccgacgac 


gatggacatt 

ggttcaatgg 

accaatttaa 

tgggcaagct 

aacttagctc 

ataaagtcga 

aaacctatgt 

ctgctactaa 

agggctacca 

tcacgtatgt 

gcaaagcata 

cacagaggaa 

attgtgatgt 

ttgactcatt 

atcttggcga 

gcctcaatga 

aatatgagca 

ttgccatcgt 

agggtgcatg 

tcaagggtgt 

tactcttgga 

tgttcatgct 

tggcgttgca 

atggcagcta 

taccatctat 

ctatgccttg 

gctttgttgg 

ctggcacaca 

cgttactgaa 

ttattctgag 

cgaagtttac 

tacattcttc 

cgacggctct 

gactactagc 


tggtgctggc 

cattggagtt 

caaggcgatt 

gcaagacgtt 

taattttggt 

ggcggaggta 

aacacaacaa 

aatgtctgag 

ccttatgtcc 

gccatcccag 

cttccctcgt 

cttcttttct 

cgttattggc 

caaagaagag 

catttcaggc 

ggtcgctaaa 

atatattaaa 

catggttaca 

ctcttgtggt 

caaattacat 

tcaattactg 

acagcaacga 

tttcttgctg 

gccctttata 

tcacatcttt 

atatattttc 

aagtgcaaat 

cataactatg 

ggtgacggca 

gataggcact 

taccagcttg 

atctttaaca 

tcaggagttg 

gtgcctttgt 


gctgctcttc 

acccaaaatg 

agtcaaattc 

gttaaccaga 

gcaatttcaa 

caaattgaca 

ctaatcaggg 

tgtgttcttg 

ttcccacaag 

gagaggaact 

gaaggtgttt 

ccacaaataa 

atcattaaca 

ctggacaagt 

attaacgctt 

aatttaaatg 

tggccttggt 

atcttgcttt 

tcttgctgca 

tacacataaa 

cacagccagt 

taccgctaca 

tttttcagag 

agggcttcca 

tgcttgtcgc 

tacaatgcat 

ccaagaaccc 

actactgtat 

tttcaacacc 

caggtgttaa 

agtctacaca 

agcttgttaa 

ctaatccagc 

aagcacaaga 
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aagtgagtac 

gaacttatgt 

actcattcgt 

ttcggaagaa 

acaggtacgt 

taatagttaa 

26160 

tagcgtactt 

ctttttcttg 

ctttcgtggt 

attcttgcta 

gtcacactag 

ccatccttac 

26220 

tgcgcttcga ttgtgtgcgt 

actgctgcaa 

tattgttaac 

gtgagtttag 

taaaaccaac 

26280 

ggtttacgtc tactcgcgtg 

ttaaaaatct 

gaactcttct 

gaaggagttc 

ctgatcttct 

26340 

ggtctaaacg 

aactaactat 

tattattatt 

ctgtttggaa 

ctttaacatt 

gcttatcatg 

26400 

gcagacaacg 

gtactattac 

cgttgaggag 

cttaaacaac 

tcctggaaca 

atggaaccta 

26460 

gtaataggtt 

tcctattcct 

agcctggatt 

atgttactac 

aatttgccta ttctaatcgg 

26520 

aacaggtttt 

tgtacataat 

aaagcttgtt 

ttcctctggc 

tcttgtggcc 

agtaacactt 

26580 

gcttgttttg 

tgcttgctgc 

tgtctacaga 

attaattggg 

tgactggcgg 

gattgcgatt 

26640 

gcaatggctt 

gtattgtagg 

cttgatgtgg 

cttagctact 

tcgttgcttc 

cttcaggctg 

26700 

tttgctcgta 

cccgctcaat 

gtggtcattc 

aacccagaaa 

caaacattct 

tctcaatgtg 

26760 

cctctccggg 

ggacaattgt 

gaccagaccg 

ctcatggaaa 

gtgaacttgt 

cattggtgct 

26820 

gtgatcattc 

gtggtcactt 

gcgaatggcc 

ggacactccc 

tagggcgctg 

tgacattaag 

26880 

gacctgccaa aagagatcac 

tgtggctaca tcacgaacgc 

tttcttatta 

caaattagga 

26940 

gcgtcgcagc 

gtgtaggcac 

tgattcaggt 

tttgctgcat 

acaaccgcta 

ccgtattgga 

27000 

aactataaat 

taaatacaga 

ccacgccggt 

agcaacgaca 

atattgcttt 

gctagtacag 

27060 

taagtgacaa 

cagatgtttc 

atcttgttga 

cttccaggtt 

acaatagcag 

agatattgat 

27120 

tatcattatg 

aggactttca 

ggattgctat 

ttggaatctt 

gacgttataa 

taagttcaat 

27180 

agtgagacaa 

ttatttaagc 

ctctaactaa 

gaagaattat 

tcggagttag 

atgatgaaga 

27240 

acctatggag 

ttagattatc 

cataaaacga 

acatgaaaat 

tattctcttc 

ctgacattga 

27300 

ttgtatttac 

atcttgcgag 

ctatatcact 

atcaggagtg 

tgttagaggt 

acgactgtac 

27360 

tactaaaaga 

accttgccca 

tcaggaacat 

acgagggcaa 

ttcaccattt 

caccctcttg 

27420 

ctgacaataa 

atttgcacta 

acttgcacta 

gcacacactt 

tgcttttgct 

tgtgctgacg 

27480 

gtactcgaca 

tacctatcag 

ctgcgtgcaa 

gatcagtttc 

accaaaactt 

ttcatcagac 

27540 

aagaggaggt 

tcaacaagag 

ctctactcgc 

cactttttct 

cattgttgct 

gctctagtat 

27600 

ttttaatact 

ttgcttcacc 

attaagagaa 

agacagaatg 

aatgagctca 

ctttaattga 

27660 

cttctatttg 

tgctttttag 

cctttctgct 

attccttgtt 

ttaataatgc 

ttattatatt 

27720 

ttggttttca 

ctcgaaatcc 

aggatctaga 

agaaccttgt 

accaaagtct 

aaacgaacat 

27780 

gaaacttctc 

attgttttga 

cttgtatttc tctatgcagt 

tgcatatgca 

ctgtagtaca 

27840 

gcgctgtgca 

tctaataaac 

ctcatgtgct 

tgaagatcct 

tgtaaggtac 

aacactaggg 

27900 

gtaatactta 

tagcactgct 

tggctttgtg 

ctctaggaaa 

ggttttacct 

tttcatagat 

27960 

ggcacactat 

ggttcaaaca 

tgcacaccta 

atgttactat 

caactgtcaa 

gatccagctg 

28020 

gtggtgcgct 

tatagctagg 

tgttggtacc ttcatgaagg 

tcaccaaact 

gctgcattta 

28080 

gagacgtact 

tgttgtttta 

aataaacgaa 

caaattaaaa 

tgtctgataa 

tggaccccaa 

28140 
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tcaaaccaac gtagtgcccc ccgcattaca 
aaccagaatg gaggacgcaa tggggcaagg 
aataatactg cgtcttggtt cacagctctc 
cctcgaggcc agggcgttcc aatcaacacc 
taccgaagag ctacccgacg agttcgtggt 
agatggtact tctattacct aggaactggc 
aaagaaggca tcgtatgggt tgcaactgag 
ggcacccgca atcctaataa caatgctgcc 
ttgccaaaag gcttctacgc agagggaagc 
tcatcacgta gtcgcggtaa ttcaagaaat 
cctgctcgaa tggctagcgg aggtggtgaa 
ttgaaccagc ttgagagcaa agtttctggt 
actaagaaat ctgctgctga ggcatctaaa 
cagtacaacg tcactcaagc atttgggaga 
ggggaccaag acctaatcag acaaggaact 
tttgctccaa gtgcctctgc attctttgga 
tcgggaacat ggctgactta tcatggagcc 
aaagacaacg tcatactgct gaacaagcac 
gagcctaaaa aggacaaaaa gaaaaagact 
aagaagcagc ccactgtgac tcttcttcct 
cttcaaaatt ccatgagtgg agcttctgct 
accacacaag gcagatgggc tatgtaaacg 
tactcttgtg cagaatgaat tctcgtaact 
atctcacata gcaatcttta atcaatgtgt 
cattttcatc gaggccacgc ggagtacgat 
ctgcctatat ggaagagccc taatgtgtaa 
attttaatag cttcttagga gaatgacaaa 

< 210>2 
<211> 3945 
<212> DNA 

<213> CORONAVIRUS 

< 220 > 

<221> CDS 
<222> (89)..(3853) 

<223> 

<400>2 


tttggtggac ccacagattc aactgacaat 
ccaaaacagc gccgacccca aggtttaccc 
actcagcatg gcaaggagga acttagattc 
aatagtggtc cagatgacca aattggctac 
ggtgacggca aaatgaaaga gctcagcccc 
ccagaagctt cacttcccta cggcgctaac 
ggagccttga atacacccaa agaccacatt 
accgtgctac aacttcctca aggaacaaca 
agaggcggca gtcaagcctc ttctcgctcc 
tcaactcctg gcagcagtag gggaaattct 
actgccctcg cgctattgct gctagacaga 
aaaggccaac aacaacaagg ccaaactgtc 
aagcctcgcc aaaaacgtac tgccacaaaa 
cgtggtccag aacaaaccca aggaaatttc 
gattacaaac attggccgca aattgcacaa 
atgtcacgca ttggcatgga agtcacacct 
attaaattgg atgacaaaga tccacaattc 
attgacgcat acaaaacatt cccaccaaca 
gatgaagctc agcctttgcc gcagagacaa 
gcggctgaca tggatgattt ctccagacaa 
gattcaactc aggcataaac actcatgatg 
ttttcgcaat tccgtttacg atacatagtc 
aaacagcaca agtaggttta gttaacttta 
aacattaggg aggacttgaa agagccacca 
cgagggtaca gtgaataatg ctagggagag 
aattaatttt agtagtgcta tccccatgtg 
aaaaaaaaaa aaaaaa 


28200 

28260 

28320 

28380 

28440 

28500 

28560 

28620 

28680 

28740 

28800 

28860 

28920 

28980 

29040 

29100 

29160 

29220 

29280 

29340 

29400 

29460 

29520 

29580 

29640 

29700 
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352 

400 

448 

496 

544 

592 
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ttctcttctg gaaaaaggta ggcttatcat tagagaaaac aacagagttg tggtttcaag 

tgatattctt gttaacaact aaacgaac atg ttt att ttc tta tta ttt ctt 

Met Phe lie Phe Leu Leu Phe Leu 
1 5 


act 

etc 

act 

agt 

ggt 

agt 

gac 

ctt 

gac 

egg 

tgc 

acc 

act 

ttt 

gat 

gat 

Thr 

Leu 

Thr 

Ser 

Gly 

Ser 

Asp 

Leu 

Asp 

Arg 

cys 

Thr 

Thr 

Phe 

Asp 

Asp 


10 





15 



20 





gtt 

caa 

get 

cct 

aat 

tac 

act 

caa 

cat 

act 

tea 

tct 

atg 

agg 

ggg 

gtt 

Val 

Gin 

Ala 

Pro 

Asn 

Tyr 

Thr 

Gin 

Hi s 

Thr 

Ser 

Ser 

Met 

Arg 

Gly 

val 

25 





30 





35 




40 

tac 

tat 

cct 

gat 

gaa 

att 

ttt 

aga 

tea 

gac 

act 

ctt 

tat 

tta 

act 

cag 

Tyr 

Tyr 

Pro 

Asp 

Glu 

lie 

Phe 

Arg 

ser 

Asp 

Thr 

Leu 

Tyr 

Leu 

Thr 

Gin 


45 




50 




55 


gat 

tta 

ttt 

ctt 

cca 

ttt 

tat 

tct 

aat 

gtt 

aca 

ggg 

ttt 

cat 

act 

att 

Asp 

Leu 

Phe 

Leu 

Pro 

Phe 

Tyr 

Ser 

Asn 

val 

Thr 

Gly 

Phe 

His 

Thr 

lie 



60 




65 





70 



aat 

cat 

aeg 

ttt 

ggc 

Gly 

aac 

cct 

gtc 

ata 

cct 

ttt 

aag 

gat 

ggt 

Gly 

att 

tat 

Asn 

Hi s 

Thr 

Phe 

Asn 

Pro 

val 

lie 

Pro 

Phe 

Lys 

Asp 

lie 

Tyr 



75 





80 




85 



ttt 

get 

gcc 

aca 

gag 

aaa 

tea 

aat 

gtt 

gtc 

cgt 

ggt 

tgg 

gtt 

ttt 

ggt 

Gly 

Phe 

Ala 

90 

Ala 

Thr 

Glu 

Lys 

ser 

95 

Asn 

val 

Val 

Arg 

Gly 

100 

Trp 

val 

Phe 

tct 

acc 

atg 

aac 

aac 

aag 

tea 

cag 

teg 

gtg 

val 

att 

att 

att 

aac 

aat 

tct 

Ser 

Thr 

Met 

Asn 

Asn 

Lys 

Ser 

Gin 

Ser 

lie 

He 

lie 

Asn 

Asn 

Ser 

105 





110 





115 





120 

act 

aat 

gtt 

gtt 

ata 

ega 

gca 

tgt 

aac 

ttt 

gaa 

ttg 

tgt 

gac 

aac 

cct 

Thr 

Asn 

Val 

val 

lie 

Arg 

Ala 

Cys 

Asn 

Phe 

Glu 

Leu 

Cys 

Asp 

Asn 

Pro 





125 



130 



135 


ttc 

ttt 

get 

gtt 

tct 

aaa 

ccc 

atg 

ggt 

Gly 

aca 

cag 

aca 

cat 

act 

atg 

ata 

Phe 

Phe 

Ala 

val 

Ser 

Lys 

pro 

Met 

Thr 

Gin 

Thr 

Hi s 

Thr 

Met 

lie 




140 




145 





150 



ttc 

gat 

aat 

gca 

ttt 

aat 

tgc 

act 

ttc 

gag 

tac 

ata 

tct 

gat 

gcc 

ttt 

Phe 

Asp 

Asn 

Ala 

Phe 

Asn 

cys 

Thr 

Phe 

Glu 

Tyr 

He 

Ser 

Asp 

Ala 

Phe 


155 




160 




165 



teg 

ctt 

gat 

gtt 

tea 

gaa 

aag 

tea 

ggt 

aat 

ttt 

aaa 

cac 

tta 

ega 

gag 

ser 

Leu 

170 

Asp 

val 

Ser 

Glu 

Lys 

175 

Ser 

Gly 

Asn 

Phe 

Lys 

180 

His 

Leu 

Arg 

Glu 

ttt 

gtg 

ttt 

aaa 

aat 

aaa 

gat 

ggg 

ttt 

etc 

tat 

gtt 

tat 

aag 

ggc 

Gly 

tat 

Phe 

val 

Phe 

Lys 

Asn 

Lys 

Asp 

Gly 

Phe 

Leu 

Tyr 

val 

Tyr 

Lys 

Tyr 

185 





190 





195 





200 

caa 

cct 

ata 

gat 

gta 

gtt 

cgt 

gat 

eta 

cct 

tct 

ggt 

ttt 

aac 

act 

ttg 

Gin 

Pro 

lie 

Asp 

val 

val 

Arg 

Asp 

Leu 

Pro 

Ser 

Gly 

Phe 

Asn 

Thr 

Leu 




205 



210 





215 


aaa 

cct 

att 

ttt 

aag 

ttg 

cct 

ctt 

ggt 

att 

aac 

att 

aca 

aat 

ttt 

aga 
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832 

880 

928 

976 

1024 

1072 

1120 

1168 

1216 

1264 

1312 

1360 

1408 

1456 

1504 

1552 

1600 
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Lys 

Pro 

lie 

Phe 

Lys 

Leu 

Pro 

Leu 

Gly 

lie 

Asn 

lie 

Thr 

Asn 

Phe 

Arg 



220 




225 





230 


gcc 

att 

ett 

aca 

gcc 

ttt 

tea 

cct 

get 

caa 

gac 

att 

tgg 

ggc 

aeg 

tea 

Ala 

lie 

Leu 

Thr 

Ala 

Phe 

Ser 

Pro 

Ala 

Gin 

Asp 

lie 

Trp 

Gly 

Thr 

Ser 



235 





240 




245 




get 

gca 

gcc 

tat 

ttt 

gtt 

ggc 

tat 

tta 

aag 

cca 

act 

aca 

ttt 

atg 

etc 

Ala 

Ala 

Ala 

Tyr 

Phe 

Val 

Gly 

Tyr 

Leu 

Lys 

Pro 

Thr 

Thr 

Phe 

Met 

Leu 


250 




255 



260 





aag 

tat 

gat 

gaa 

aat 

ggt 

Gly 

aca 

ate 

aca 

gat 

get 

gtt 

gat 

tgt 

tet 

caa 

Lys 

Tyr 

Asp 

Glu 

Asn 

Thr 

lie 

Thr 

Asp 

Ala 

val 

Asp 

Cys 

Ser 

Gin 

265 



270 





275 





280 

aat 

cca 

ett 

get 

gaa 

etc 

aaa 

tgc 

tet 

gtt 

aag 

age 

ttt 

gag 

att 

gac 

Asn 

pro 

Leu 

Ala 

Glu 

Leu 

Lys 

Cys 

Ser 

val 

Lys 

ser 

Phe 

Glu 

lie 

Asp 





285 



290 




295 


aaa 

gga 

att 

tac 

cag 

acc 

tet 

aat 

ttc 

agg 

gtt 

gtt 

ccc 

tea 

gga 

Gly 

gat 

Lys 

Gly 

lie 

Tyr 

Gin 

Thr 

ser 

Asn 

Phe 

Arg 

val 

Val 

Pro 

Ser 

Asp 


300 





305 





310 



gtt 

gtg 

val 

aga 

ttc 

cct 

aat 

att 

aca 

aac 

ttg 

tgt 

cct 

ttt 

gga 

Gly 

gag 

gtt 

val 

Arg 

Phe 

Pro 

Asn 

lie 

Thr 

Asn 

Leu 

cys 

Pro 

Phe 

Glu 

val 



315 





320 




325 




ttt 

aat 

get 

act 

aaa 

ttc 

cct 

tet 

gtc 

tat 

gca 

tgg 

gag 

aga 

aaa 

aaa 

Phe 

Asn 

Ala 

Thr 

Lys 

Phe 

Pro 

Ser 

val 

Tyr 

Ala 

Trp 

Glu 

Arg 

Lys 

Lys 


330 




335 




340 





att 

tet 

aat 

tgt 

gtt 

get 

gat 

tac 

tet 

gtg 

Val 

etc 

tac 

aac 

tea 

aca 

ttt 

lie 

ser 

Asn 

cys 

val 

Al a 

Asp 

Tyr 

ser 

Leu 

Tyr 

Asn 

ser 

Thr 

Phe 

345 




350 



355 





360 

ttt 

tea 

ace 

ttt 

aag 

tgc 

tat 

ggc 

gtt 

tet 

gee 

act 

aag 

ttg 

aat 

gat 

Phe 

Ser 

Thr 

Phe 

Lys 

cys 

Tyr 

Gly 

Val 

ser 

Ala 

Thr 

Lys 

Leu 

Asn 

Asp 





365 



370 





375 


ett 

tgc 

ttc 

tee 

aat 

gtc 

tat 

gca 

gat 

tet 

ttt 

gta 

gtc 

aag 

gga 

gat 

Leu 

cys 

Phe 

Ser 

Asn 

val 

Tyr 

Ala 

Asp 

ser 

Phe 

Val 

val 

Lys 

Gly 

Asp 



380 




385 





390 



gat 

gta 

aga 

caa 

ata 

geg 

cca 

gga 

Gly 

caa 

act 

ggt 

Gly 

gtt 

att 

get 

gat 

tat 

Asp 

Val 

Arg 

Gin 

He 

Ala 

Pro 

Gin 

Thr 

val 

lie 

Ala Asp 

Tyr 


395 





400 





405 




aat 

tat 

aaa 

ttg 

cca 

gat 

gat 

ttc 

atg 

ggt 

Gly 

tgt 

gtc 

ett 

get 

tgg 

aat 

Asn 

Tyr 

Lys 

Leu 

pro 

Asp 

Asp 

Phe 

Met 

cys 

val 

Leu 

Ala Trp 

Asn 


410 




415 





420 





act 

agg 

aac 

att 

gat 

get 

act 

tea 

act 

ggt 

Gly 

aat 

tat 

aat 

tat 

aaa 

tat 

Thr 

Arg 

Asn 

lie 

Asp 

Ala 

Thr 

Ser 

Thr 

Asn 

Tyr 

Asn 

Tyr 

Lys 

Tyr 

425 



430 





435 





440 

agg 

tat 

ett 

aga 

cat 

ggc 

aag 

ett 

agg 

ccc 

ttt 

gag 

aga 

gac 

ata 

tet 

Arg 

Tyr 

Leu 

Arg 

Hi s 

Gly 

Lys 

Leu 

Arg 

Pro 

Phe 

Glu 

Arg 

Asp 

lie 

ser 


445 



450 





455 


aat 

gtg 

Val 

cct 

ttc 

tcc 

cct 

gat 

ggc 

aaa 

cct 

tgc 

acc 

cca 

cct 

get 

ett 

Asn 

Pro 

Phe 

Ser 

Pro 

Asp 

Gly 

Lys 

Pro 

cys 

Thr 

Pro 

Pro 

Ala 

Leu 




460 




465 




470 



aat 

tgt 

tat 

tgg 

cca 

tta 

aat 

gat 

tat 

ggt 

Gly 

ttt 

tac 

acc 

act 

act 

ggc 

Gly 

Asn 

cys 

Tyr 

Trp 

Pro 

Leu 

Asn 

Asp 

Tyr 

Phe 

Tyr 

Thr 

Thr 

Thr 



475 




480 




485 




att 

ggc 

tac 

caa 

cct 

tac 

aga 

gtt 

gta 

gta 

ett 

tet 

ttt 

gaa 

ett 

tta 
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1648 

1696 

1744 

1792 

1840 

1888 

1936 

1984 

2032 

2080 

2128 

2176 

2224 

2272 

2320 

2368 

2416 
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lie 

Gly 

Tyr 

Gin 

Pro 

Tyr 

Arg 

val 

val 

val 

Leu 

ser 

phe 

Gl u 

Leu 

Leu 


490 



495 





500 





aat 

gca 

ccg 

gee 

aeg 

gtt 

tgt 

gga 

cca 

aaa 

tta 

tec 

act 

gac 

ett 

att 

Asn 

Ala 

Pro 

Ala 

Thr 

val 

cys 

Gly 

Pro 

Lys 

Leu 

Ser 

Thr 

Asp 

Leu 

lie 

505 





510 



515 




520 

aag 

aac 

cag 

tgt 

gtc 

aat 

ttt 

aat 

ttt 

aat 

gg a 

etc 

act 

ggt 

act 

ggt 

Lys 

Asn 

Gin 

cys 

val 

Asn 

Phe 

Asn 

Phe 

Asn 

Gly 

Leu 

Thr 

Gly 

Thr 

Gly 



525 





530 





535 


gtg 

tta 

act 

cct 

tet 

tea 

aag 

aga 

ttt 

caa 

cca 

ttt 

caa 

caa 

ttt 

ggc 

val 

Leu 

Thr 

pro 

Ser 

ser 

Lys 

Arg 

Phe 

Gin 

Pro 

Phe 

Gin 

Gl n 

Phe 

Gly 




540 



545 





550 



cgt 

gat 

gtt 

tet 

gat 

ttc 

act 

gat 

tec 

gtt 

ega 

gat 

cct 

aaa 

aca 

tet 

Arg 

Asp 

Val 

555 

ser 

Asp 

Phe 

Thr 

Asp 

560 

ser 

val 

Arg 

Asp 

Pro 

565 

Lys 

Thr 

Ser 

gaa 

ata 

tta 

gac 

att 

tea 

cct 

tgc 

tet 

ttt 

ggg 

ggt 

gta 

agt 

gta 

att 

Glu 

lie 

Leu 

Asp 

lie 

ser 

Pro 

cys 

ser 

Phe 

Gly 

Gly 

val 

ser 

val 

lie 


570 




575 




580 





aca 

cct 

gga 

aca 

aat 

get 

tea 

tet 

gaa 

gtt 

get 

gtt 

eta 

tat 

caa 

gat 

Thr 

Pro 

Gly 

Thr 

Asn 

Ala 

Ser 

Ser 

Glu 

val 

Ala 

Val 

Leu 

Tyr 

Gin 

Asp 

585 





590 





595 




600 

gtt 

aac 

tgc 

act 

gat 

gtt 

tet 

aca 

gca 

att 

cat 

gca 

gat 

caa 

etc 

aca 

Val 

Asn 

cys 

Thr 

Asp 

val 

Ser 

Thr 

Ala 

lie 

Hi s 

Ala 

Asp 

Gl n 

Leu 

Thr 




605 





610 




615 


cca 

get 

tgg 

ege 

ata 

tat 

tet 

act 

gga 

aac 

aat 

gta 

ttc 

cag 

act 

caa 

Pro 

Ala 

Trp 

Arg 

lie 

Tyr 

Ser 

Thr 

Gly 

Asn 

Asn 

Val 

Phe 

Gin 

Thr 

Gin 



620 




625 





630 



gca 

ggc 

tgt 

ett 

ata 

gga 

get 

gag 

cat 

gtc 

gac 

act 

tet 

tat 

gag 

tgc 

Ala 

Gly 

Cys 

Leu 

He 

Gly 

Ala 

Glu 

His 

Val 

Asp 

Thr 

Ser 

Tyr 

Glu 

cys 



635 





640 




645 


gac 

att 

cct 

att 

gga 

get 

ggc 

att 

tgt 

get 

agt 

tac 

cat 

aca 

gtt 

tet 

Asp 

lie 

Pro 

lie 

Gly 

Ala 

Gly 

lie 

cys 

Ala 

Ser 

Tyr 

Hi s 

Thr 

Val 

Ser 

650 





655 




660 





tta 

tta 

cgt 

agt 

act 

age 

caa 

aaa 

tet 

att 

gtg 

get 

tat 

act 

atg 

tet 

Leu 

Leu 

Arg 

Ser 

Thr 

ser 

Gin 

Lys 

Ser 

lie 

val 

Ala 

Tyr 

Thr 

Met 

Ser 

665 




670 




675 




680 

tta 

ggt 

get 

gat 

agt 

tea 

att 

get 

tac 

tet 

aat 

aac 

acc 

att 

get 

ata 

Leu 

Gly 

Ala 

Asp 

Ser 

Ser 

He 

Ala 

Tyr 

ser 

Asn 

Asn 

Thr 

He 

Ala 

lie 




685 




690 





695 


cct 

act 

aac 

ttt 

tea 

att 

age 

att 

act 

aca 

gaa 

gta 

atg 

cct 

gtt 

tet 

Pro 

Thr 

Asn 

Phe 

Ser 

lie 

Ser 

lie 

Thr 

Thr 

Glu 

val 

Met 

Pro 

val 

Ser 




700 





705 





710 



atg 

get 

aaa 

acc 

tcc 

gta 

gat 

tgt 

aat 

atg 

tac 

ate 

tgc 

gga 

gat 

tet 

Met 

Ala 

Lys 

Thr 

Ser 

Val 

Asp 

Cys 

Asn 

Met 

Tyr 

lie 

cys 

Gly 

Asp 

Ser 



715 




720 




725 




act 

gaa 

tgt 

get 

aat 

ttg 

ett 

etc 

caa 

tat 

ggt 

age 

ttt 

tgc 

aca 

caa 

Thr 

Gl u 

cys 

Ala 

Asn 

Leu 

Leu 

Leu 

Gin 

Tyr 

Gly 

ser 

Phe 

cys 

Thr 

Gin 


730 




735 




740 





eta 

aat 

cgt 

gca 

etc 

tea 

ggt 

att 

get 

get 

gaa 

cag 

gat 

ege 

aac 

aca 

Leu 

Asn 

Arg 

Ala 

Leu 

Ser 

Gly 

lie 

Ala 

Ala 

Glu 

Gin 

Asp 

Arg 

Asn 

Thr 

745 




750 





755 



760 

cgt 

gaa 

gtg 

ttc 

get 

caa 

gtc 

aaa 

caa 

atg 

tac 

aaa 

acc 

cca 

act 

ttg 
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Arg 

Glu 

Val 

Phe 

Ala 

Gin 

Val 

Lys 

Gin 

Met 

Tyr 

Lys 

Thr 

Pro 

Thr 

Leu 




765 




770 



775 


aaa 

tat 

ttt 

ggt 

ggt 

ttt 

aat 

ttt 

tea 

caa 

ata 

tta 

cct 

gac 

cct 

eta 

Lys 

Tyr 

Phe 

Gly 

Gly 

Phe 

Asn 

Phe 

ser 

Gin 

lie 

Leu 

Pro 

Asp 

Pro 

Leu 


780 





785 





790 



aag 

cca 

act 

aag 

agg 

tet 

ttt 

att 

gag 

gac 

ttg 

etc 

ttt 

aat 

aag 

gtg 

Lys 

Pro 

Thr 

Lys 

Arg 

Ser 

Phe 

lie 

Glu 

Asp 

Leu 

Leu 

Phe 

Asn 

Lys 

val 


795 



800 




805 




aca 

etc 

get 

gat 

get 

ggc 

ttc 

atg 

aag 

caa 

tat 

ggc 

gaa 

tgc 

eta 

ggt 

Thr 

Leu 

Ala 

Asp 

Ala 

Gly 

Phe 

Met 

Lys 

Gin 

Tyr 

Gly 

Glu 

Cys 

Leu 

Gly 


810 




815 



820 





gat 

att 

aat 

get 

aga 

gat 

etc 

att 

tgt 

geg 

cag 

aag 

ttc 

aat 

gga 

ett 

Asp 

lie 

Asn 

Ala 

Arg 

Asp 

Leu 

lie 

Cys 

Ala 

Gin 

Lys 

Phe 

Asn 

Gly 

Leu 

825 




830 




835 





840 

aca 

gtg 

ttg 

cca 

cct 

ctg 

etc 

act 

gat 

gat 

atg 

att 

get 

gee 

tac 

act 

Thr 

val 

Leu 

Pro 

Pro 

Leu 

Leu 

Thr 

Asp 

Asp 

Met 

lie 

Ala 

Ala 

Tyr 

Thr 





845 




850 





855 


get 

get 

eta 

gtt 

agt 

ggt 

act 

gee 

act 

get 

gga 

tgg 

aca 

ttt 

ggt 

get 

Ala 

Ala 

Leu 

val 

Ser 

Gly 

Thr 

Ala 

Thr 

Ala 

Gly 

Trp 

Thr 

Phe 

Gly 

Ala 




860 





865 




870 



ggc 

get 

get 

ett 

caa 

ata 

cct 

ttt 

get 

atg 

caa 

atg 

gca 

tat 

agg 

ttc 

Gly 

Ala 

Ala 

Leu 

Gin 

He 

Pro 

Phe 

Ala 

Met 

Gin 

Met 

Ala 

Tyr 

Arg 

Phe 



875 





880 





885 


aat 

ggc 

att 

gga 

gtt 

acc 

caa 

aat 

gtt 

etc 

tat 

gag 

aac 

caa 

aaa 

caa 

Asn 

Gly 

lie 

Gly 

val 

Thr 

Gin 

Asn 

val 

Leu 

Tyr 

Glu 

Asn 

Gin 

Lys 

Gin 


890 





895 




900 




ate 

gee 

aac 

caa 

ttt 

aac 

aag 

geg 

att 

agt 

caa 

att 

caa 

gaa 

tea 

ett 

lie 

Ala 

Asn 

Gin 

Phe 

Asn 

Lys 

Ala 

He 

Ser 

Gin 

He 

Gin 

Glu 

Ser 

Leu 

905 





910 




915 





920 

aca 

aca 

aca 

tea 

act 

gca 

ttg 

ggc 

aag 

ctg 

caa 

gac 

gtt 

gtt 

aac 

cag 

Thr 

Thr 

Thr 

ser 

Thr 

Ala 

Leu 

Gly 

Lys 

Leu 

Gin 

Asp 

Val 

Val 

Asn 

Gin 





925 




930 




935 


aat 

get 

caa 

gca 

tta 

aac 

aca 

ett 

gtt 

aaa 

caa 

ett 

age 

tet 

aat 

ttt 

Asn 

Ala 

Gin 

Ala 

Leu 

Asn 

Thr 

Leu 

val 

Lys 

Gin 

Leu 

Ser 

Ser 

Asn 

Phe 




940 





945 




950 



ggt 

gca 

att 

tea 

agt 

gtg 

eta 

aat 

gat 

ate 

ett 

teg 

ega 

ett 

gat 

aaa 

Gly 

Ala 

He 

ser 

Ser 

val 

Leu 

Asn 

Asp 

He 

Leu 

ser 

Arg 

Leu 

Asp 

Lys 



955 





960 




965 


gtc 

gag 

geg 

gag 

gta 

caa 

att 

gac 

agg 

tta 

att 

aca 

ggc 

aga 

ett 

caa 

val 

Glu 

Ala 

Glu 

Val 

Gin 

He 

Asp 

Arg 

Leu 

lie 

Thr 

Gly 

Arg 

Leu 

Gin 


970 





975 



980 




age 

ett 

caa 

acc 

tat 

gta 

aca 

caa 

caa 

eta 

ate 

agg 

get 

get 

gaa 

ate 

ser 

Leu 

Gin 

Thr 

Tyr 

Val 

Thr 

Gin 

Gin 

Leu 

lie 

Arg 

Ala 

Ala 

Glu 

He 

985 




990 





995 




1000 


agg get tet get aat ett get get act aaa atg tet gag tgt gtt 

Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val 

1005 1010 1015 

ett gga caa tea aaa aga gtt gac ttt tgt gqa aag ggc tac cac 

Leu Gly Gin Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His 

1020 1025 1030 

ett atg tee ttc cca caa gca gee ccg cat ggt gtt gtc ttc eta 
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Leu 

Met 

Ser 

Phe 

Pro 

1035 

Gin 

Ala 

Ala 

Pro 

Hi s 
1040 

Gly 

val 

val 

Phe 

Leu 

1045 

cat 

His 

gt c 

val 

aeg 

Thr 

tat 

Tyr 

gtg 

val 

1050 

cca 

Pro 

tee 

Ser 

cag 

Gin 

gag 

Glu 

agg 

Arg 

1055 

aac 

Asn 

ttc 

Phe 

acc 

Thr 

aca 

Thr 

geg 

Ala 

1060 

cca 

Pro 

gca 

Ala 

att 

lie 

tgt 

cys 

cat 

His 

1065 

gaa 

Glu 

ggc 

Gly 

aaa 

Lys 

gca 

Ala 

tac 

Tyr 

1070 

ttc 

Phe 

cct 

Pro 

cgt 

Arg 

gaa 

Glu 

ggt 

Gly 

1075 

gtt 

val 

ttt 

Phe 

gtg 

val 

ttt 

Phe 

aat 

Asn 

1080 

ggc 

Gly 

act 

Thr 

tet 

Ser 

tgg 

Trp 

ttt 

Phe 

1085 

att 

lie 

aca 

Thr 

cag 

Gin 

agg 

Arg 

aac 

Asn 

1090 

ttc 

Phe 

ttt 

Phe 

tet 

ser 

cca 

Pro 

caa 

Gin 

1095 

ata 

lie 

att 

lie 

act 

Thr 

aca 

Thr 

gac 

Asp 

1100 

aat 

Asn 

aca 

Thr 

ttt 

Phe 

gtc 

val 

tea 

ser 

1105 

gga 

Gly 

aat 

Asn 

tgt 

cys 

gat 

Asp 

gtc 

val 

1110 

gtt 

val 

att 

lie 

ggc 

Gly 

ate 

lie 

att 

lie 

1115 

aac 

Asn 

aac 

Asn 

aca 

Thr 

gtt 

val 

tat 

Tyr 

1120 

gat 

Asp 

cct 

Pro 

ctg 

Leu 

caa 

Gin 

cct 

Pro 

1125 

gag 

Glu 

ett 

Leu 

gac 

Asp 

tea 

Ser 

ttc 

Phe 

1130 

aaa 

Lys 

gaa 

Glu 

gag 

Glu 

ctg 

Leu 

gac 

Asp 

1135 

aag 

Lys 

tac 

Tyr 

ttc 

Phe 

aaa 

Lys 

aat 

Asn 

1140 

cat 

His 

aca 

Thr 

tea 

Ser 

cca 

Pro 

gat 

Asp 

1145 

gtt 

val 

gat 

Asp 

ett 

Leu 

ggc 

Gly 

gac 

Asp 

1150 

att 

lie 

tea 

Ser 

ggc 

Gly 

att 

He 

aac 

Asn 

1155 

get 

Ala 

tet 

Ser 

gtc 

val 

gtc 

val 

aac 

Asn 

1160 

att 

lie 

caa 

Gin 

aaa 

Lys 

gaa 

Glu 

att 

lie 

1165 

gac 

Asp 

ege 

Arg 

etc 

Leu 

aat 

Asn 

gag 

Glu 

1170 

gtc 

val 

get 

Ala 

aaa 

Lys 

aat 

Asn 

tta 

Leu 

1175 

aat 

Asn 

gaa 

Glu 

tea 

Ser 

etc 

Leu 

att 

lie 

1180 

gac 

Asp 

ett 

Leu 

caa 

Gin 

gaa 

Glu 

ttg 

Leu 

1185 

gga 

Gly 

aaa 

Lys 

tat 

Tyr 

gag 

Glu 

caa 

Gin 

1190 

tat 

Tyr 

att 

lie 

aaa 

Lys 

tgg 

Trp 

cct 

Pro 

1195 

tgg 

Trp 

tat 

Tyr 

gtt 

val 

tgg 

Trp 

etc 

Leu 

1200 

ggc 

Gly 

ttc 

Phe 

att 

He 

get 

Ala 

gga 

Gly 

1205 

eta 

Leu 

att 

lie 

gee 

Ala 

ate 

lie 

gtc 

val 

1210 

atg 

Met 

gtt 

val 

aca 

Thr 

ate 

lie 

ttg 

Leu 

1215 

ett 

Leu 

tgt 

cys 

tgc 

cys 

atg 

Met 

act 

Thr 

1220 

agt 

Ser 

tgt 

Cys 

tgc 

cys 

agt 

Ser 

tgc 

Cys 

1225 

etc 

Leu 

aag 

Lys 

ggt 

Gly 

gca 

Ala 

tgc 

Cys 

1230 

tet 

Ser 

tgt 

Cys 

ggt 

Gly 

tet 

ser 

tgc 

Cys 

1235 

tgc 

cys 

aag 

Lys 

ttt 

Phe 

gat 

Asp 

gag 

Glu 

1240 

gat 

Asp 

gac 

Asp 

tet 

Ser 

gag 

Glu 

cca 

Pro 

1245 

gtt 

val 

etc 

Leu 

aag 

Lys 

ggt 

Gly 

gtc 

Val 

1250 

aaa 

Lys 

tta 

Leu 

cat 
Hi s 

tac 

Tyr 

aca 

Thr 

1255 
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<212> PRT 

<213> CORONAVIRUS 
<400>3 


Met 

Phe 

lie 

Phe 

Leu 

Leu 

Phe 

Leu 

Thr 

Leu 

Thr 

Ser 

Gly 

ser 

Asp 

Leu 

1 




5 





10 




15 


Asp 

Arg 

cys 

Thr 

Thr 

Phe 

Asp 

Asp 

val 

Gin 

Ala 

Pro 

Asn 

Tyr 

Thr 

Gin 


20 





25 





30 



His 

Thr 

Ser 

Ser 

Met 

Arg 

Gly 

Val 

Tyr 

Tyr 

Pro 

Asp 

Glu 

lie 

Phe 

Arg 



35 





40 





45 




Ser 

Asp 

Thr 

Leu 

Tyr 

Leu 

Thr 

Gin 

Asp 

Leu 

Phe 

Leu 

Pro 

Phe 

Tyr 

ser 


50 
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60 




Asn 

Val 

Thr 

Gly 

Phe 

His 

Thr 

lie 

Asn 

Hi s 

Thr 

Phe 

Gly 

Asn 

Pro 

val 

65 





70 





75 




80 

lie 

Pro 

Phe 

Lys 

Asp 

Gly 

lie 

Tyr 

Phe 

Ala 

Ala 

Thr 

Glu 

Lys 

ser 

Asn 




85 



90 





95 


Val 

Val 

Arg 

Gly 

Trp 

Val 

Phe 

Gly 

Ser 

Thr 

Met 

Asn 

Asn 

Lys 

Ser 

Gin 



100 



105 





110 



Ser 

val 

lie 

lie 

lie 

Asn 

Asn 

Ser 

Thr 

Asn 

val 

val 

lie 

Arg 

Ala 

Cys 



115 





120 





125 


Asn 

Phe 

Glu 

Leu 

Cys 

Asp 

Asn 

Pro 

Phe 

Phe 

Ala 

val 

ser 

Lys 

Pro 

Met 


130 



135 





140 




Gly 

Thr 

Gin 

Thr 

His 

Thr 

Met 

lie 

Phe 

Asp 

Asn 

Ala 

Phe 

Asn 

Cys 

Thr 

145 





150 




155 




160 

Phe 

Glu 

Tyr 

lie 

Ser 

Asp 

Ala 

Phe 

Ser 

Leu 

Asp 

Val 

Ser 

Glu 

Lys 

Ser 




165 




170 




175 


Gly 

Asn 

Phe 

Lys 

Hi s 

Leu 

Arg 

Glu 

Phe 

val 

Phe 

Lys 

Asn 

Lys 

Asp 

Gly 




180 




185 





190 



Phe 

Leu 

Tyr 

Val 

Tyr 

Lys 

Gly 

Tyr 

Gin 

Pro 

lie 

Asp 

Val 

val 

Arg 

Asp 



195 





200 





205 




Leu 

Pro 

Ser 

Gly 

Phe 

Asn 

Thr 

Leu 

Lys 

Pro 

He 

Phe 

Lys 

Leu 

Pro 

Leu 


210 




215 




220 




Gly 

lie 

Asn 

lie 

Thr 

Asn 

Phe 

Arg 

Ala 

He 

Leu 

Thr 

Ala 

Phe 

Ser 

Pro 

225 





230 




235 





240 
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Ala 

Gin 

Asp 

lie 

Trp 

245 

Gly 

Thr 

Ser 

Leu 

Lys 

Pro 

Thr 

Thr 

Phe 

Met 

Leu 



260 





Thr 

Asp 

Ala 

Val 

Asp 

Cys 

Ser 

Gin 



275 




280 

Ser 

val 

Lys 

Ser 

Phe 

Glu 

lie 

Asp 


290 




295 

Phe 

Arg 

Val 

val 

Pro 

Ser 

Gly 

Asp 

305 




310 


Asn 

Leu 

cys 

Pro 

Phe 

Gly 

Glu 

Val 




325 



val 

Tyr 

Ala 

Trp 

Glu 

Arg 

Lys 

Lys 




340 





Ser 

Val 

Leu 

Tyr 

Asn 

Ser 

Thr 

Phe 



355 




360 

val 

Ser 

Ala 

Thr 

Lys 

Leu 

Asn 

Asp 


370 




375 

Asp 

Ser 

Phe 

val 

val 

Lys 

Gly 

Asp 

385 





390 



Gin 

Thr 

Gly 

Val 

lie 

Ala 

Asp 

Tyr 





405 


Met 

Gly 

Cys 

Val 

Leu 

Ala 

Trp 

Asn 


420 




Thr 

Gly 

Asn 

Tyr 

Asn 

Tyr 

Lys 

Tyr 



435 




440 

Arg 

Pro 

Phe 

Glu 

Arg 

Asp 

lie 

ser 

450 



455 


Lys 

Pro 

cys 

Thr 

Pro 

pro 

Ala 

Leu 

465 




470 



Tyr 

Gly 

Phe 

Tyr 

Thr 

Thr 

Thr 

Gly 




485 




val 

val 

Leu 

Ser 

Phe 

Glu 

Leu 

Leu 


500 


Ala 

Ala 

Ala 

Tyr 

Phe 

val 

Gly 

Tyr 


250 




255 


Lys 

Tyr 

Asp 

Glu 

Asn 

Gly 

Thr 

lie 

265 



270 



Asn 

Pro 

Leu 

Ala 

Glu 

285 

Leu 

Lys 

Cys 

Lys 

Gly 

He 

Tyr 

Gin 

Thr 

Ser 

Asn 


300 





val 

Val 

Arg 

Phe 

Pro 

Asn 

lie 

Thr 



315 





320 

Phe 

Asn 

Ala 

Thr 

Lys 

Phe 

Pro 

Ser 


330 




335 


lie 

Ser 

Asn 

Cys 

Val 

Ala 

Asp 

Tyr 

345 





350 



Phe 

Ser 

Thr 

Phe 

Lys 

cys 

Tyr 

Gly 





365 




Leu 

Cys 

Phe 

Ser 

Asn 

Val 

Tyr 

Ala 



380 




Asp 

val 

Arg 

Gin 

lie 

Ala 

Pro 

Gly 


395 





400 

Asn 

Tyr 

Lys 

Leu 

Pro 

Asp 

Asp 

Phe 


410 




415 


Thr 

Arg 

Asn 

lie 

Asp 

Ala 

Thr 

Ser 

425 



430 



Arg 

Tyr 

Leu 

Arg 

Hi s 
445 

Gly 

Lys 

Leu 

Asn 

Val 

Pro 

Phe 

460 

Ser 

Pro 

ASp 

Gly 

Asn 

Cys 

Tyr 

Trp 

Pro 

Leu 

Asn 

Asp 



475 





480 

lie 

Gly 

Tyr 

Gin 

Pro 

Tyr 

Arg 

Val 


490 



495 


Asn 

Ala 

Pro 

Ala 

Thr 

val 

cys 

Gly 

505 





510 
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pro 

Lys 

Leu 

Ser 

Thr 

Asp 

Leu 

lie 

Lys 

Asn 

Gin 

cys 

val 

Asn 

Phe 

Asn 


515 




520 



525 




Phe 

Asn 

Gly 

Leu 

Thr 

Gly 

Thr 

Gly 

val 

Leu 

Thr 

Pro 

Ser 

ser 

Lys 

Arg 


530 



535 




540 




Phe 

Gin 

Pro 

Phe 

Gin 

Gin 

Phe 

Gly 

Arg 

Asp 

val 

ser 

Asp 

Phe 

Thr 

Asp 

545 





550 


555 





560 

ser 

Val 

Arg 

Asp 

Pro 

Lys 

Thr 

Ser 

Glu 

lie 

Leu 

Asp 

He 

Ser 

Pro 

cys 



565 




570 




575 

ser 

Phe 

Gly 

Gly 

val 

Ser 

val 

lie 

Thr 

Pro 

Gly 

Thr 

Asn 

Ala 

Ser 

ser 



580 





585 




590 



Glu 

val 

Ala 

val 

Leu 

Tyr 

Gin 

Asp 

val 

Asn 

cys 

Thr 

Asp 

Val 

Ser 

Thr 



595 




600 




605 




Ala 

lie 

Hi s 

Ala 

Asp 

Gin 

Leu 

Thr 

Pro 

Ala 

Trp 

Arg 

lie 

Tyr 

Ser 

Thr 


610 




615 




620 





Gly 

Asn 

Asn 

Val 

Phe 

Gin 

Thr 

Gl n 

Ala 

Gly 

cys 

Leu 

lie 

Gly 

Ala 

Glu 

625 





630 




635 




640 

His 

Val 

Asp 

Thr 

Ser 

Tyr 

Glu 

Cys 

Asp 

lie 

Pro 

lie 

Gly 

Ala 

Gly 

lie 




645 


650 





655 


Cys 

Ala 

ser 

Tyr 

His 

Thr 

Val 

Ser 

Leu 

Leu 

Arg 

Ser 

Thr 

Ser 

Gin 

Lys 



660 





665 




670 



Ser 

lie 

val 

Ala 

Tyr 

Thr 

Met 

Ser 

Leu 

Gly 

Ala 

ASp 

Ser 

ser 

lie 

Ala 



675 




680 



685 




Tyr 

Ser 

Asn 

Asn 

Thr 

lie 

Al a 

lie 

Pro 

Thr 

Asn 

Phe 

Ser 

lie 

Ser 

lie 

690 





695 





700 





Thr 

Thr 

Glu 

val 

Met 

Pro 

val 

Ser 

Met 

Ala 

Lys 

Thr 

Ser 

val 

Asp 

Cys 

705 





710 





715 




720 

Asn 

Met 

Tyr 

lie 

cys 

Gly 

Asp 

Ser 

Thr 

Glu 

cys 

Ala 

Asn 

Leu 

Leu 

Leu 





725 



730 




735 


Gin 

Tyr 

Gly 

Ser 

Phe 

Cys 

Thr 

Gin 

Leu 

Asn 

Arg 

Al a 

Leu 

ser 

Gly 

lie 



740 




745 




750 



Ala 

Ala 

Glu 

Gin 

Asp 

Arg 

Asn 

Thr 

Arg 

Glu 

Val 

Phe 

Ala 

Gin 

Val 

Lys 



755 



760 




765 



Gin 

Met 

Tyr 

Lys 

Thr 

Pro 

Thr 

Leu 

Lys 

Tyr 

Phe 

Gly 

Gly 

Phe 

Asn 

Phe 


770 



775 



780 
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Ser 

Gin 

lie 

Leu 

Pro 

Asp 

Pro 

Leu 

Lys 

Pro 

Thr 

Lys 

Arg 

Ser 

Phe 

He 

785 





790 




795 



800 

Glu 

Asp 

Leu 

Leu 

Phe 

Asn 

Lys 

val 

Thr 

Leu 

Ala 

Asp 

Ala 

Gly 

Phe 

Met 




805 




810 



815 


Lys 

Gin 

Tyr 

Gly 

Glu 

Cys 

Leu 

Gly 

Asp 

lie 

Asn 

Ala 

Arg 

Asp 

Leu 

He 



820 



825 




830 



cys 

Ala 

Gin 

Lys 

Phe 

Asn 

Gly 

Leu 

Thr 

val 

Leu 

Pro 

Pro 

Leu 

Leu 

Thr 


835 




840 





845 




Asp 

Asp 

Met 

lie 

Ala 

Ala 

Tyr 

Thr 

Ala 

Ala 

Leu 

val 

ser 

Gly 

Thr 

Al a 

850 





855 





860 




Thr 

Ala 

Gly 

Trp 

Thr 

Phe 

Gly 

Ala 

Gly 

Ala 

Ala 

Leu 

Gin 

He 

Pro 

Phe 

865 



870 



875 





880 

Ala 

Met 

Gin 

Met 

Ala 

Tyr 

Arg 

Phe 

Asn 

Gly 

He 

Gly 

val 

Thr 

Gin 

Asn 





885 



890 




895 


Val 

Leu 

Tyr 

Glu 

Asn 

Gin 

Lys 

Gin 

He 

Ala 

Asn 

Gin 

Phe 

Asn 

Lys 

Ala 



900 




905 





910 


lie 

Ser 

Gin 

lie 

Gin 

Glu 

Ser 

Leu 

Thr 

Thr 

Thr 

ser 

Thr 

Ala 

Leu 

Gly 



915 





920 





925 



Lys 

Leu 

Gin 

Asp 

Val 

val 

Asn 

Gin 

Asn 

Ala 

Gin 

Ala 

Leu 

Asn 

Thr 

Leu 

930 




935 





940 





val 

Lys 

Gin 

Leu 

ser 

ser 

Asn 

Phe 

Gly 

Ala 

He 

Ser 

Ser 

Val 

Leu 

Asn 

945 




950 




955 





960 

Asp 

lie 

Leu 

ser 

Arg 

Leu 

Asp 

Lys 

Val 

Glu 

Ala 

Glu 

Val 

Gin 

lie 

Asp 





965 




970 





975 

Arg 

Leu 

lie 

Thr 

Gly 

Arg 

Leu 

Gin 

Ser 

Leu 

Gin 

Thr 

Tyr 

Val 

Thr 

Gin 



980 



985 




990 



Gin 

Leu 

lie 

Arg 

Ala 

Ala 

Glu 

He 

Arg Ala ser Ala Asn Leu Al 

la Al 



995 




1000 




1005 



Thr 

Lys 

Met 

: Ser 

’ Glu 

i cys 

; Val 

Leu Gly Gl 

In Ser Lys Arg val Asp 


1010 




1015 




1020 




Phe 

cys 

Gly Lys Gly Tyr 

’ His 

; Leu Met Ser Phe Pro Gin Ala Ala 


1025 




1030 




1035 




Pro 

His 

Gl > 

' Val 

Val 

Phe Leu 

i Hi 

is val Thr Tyr val Pro Ser Gin 


1040 1045 1050 
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Glu 

Arg 

1055 

Asn 

Phe 

Thr 

Thr 

Ala 

1060 

Pro 

Ala 

lie 

cys 

His 

1065 

Glu 

Gly 

Lys 

Ala 

Tyr 

1070 

Phe 

Pro 

Arg 

Glu 

Gly 

1075 

Val 

Phe 

val 

Phe 

Asn 

1080 

Gly 

Thr 

Ser 

Trp 

Phe 

1085 

lie 

Thr 

Gin 

Arg 

Asn 

1090 

Phe 

Phe 

ser 

Pro 

Gin 

1095 

lie 

lie 

Thr 

Thr 

ASP 

1100 

Asn 

Thr 

Phe 

val 

Ser 

1105 

Gly 

Asn 

cys 

Asp 

val 

1110 

val 

lie Gly 

lie 

lie 

1115 

Asn 

Asn 

Thr 

val 

Tyr 

1120 

Asp 

Pro 

Leu 

Gin 

Pro 

1125 

Glu 

Leu 

Asp 

Ser 

Phe 

1150 

Lys 

Glu 

Glu 

Leu 

Asp 

1135 

Lys 

Tyr 

Phe 

Lys 

Asn 

1140 

His 

Thr 

ser 

Pro 

Asp 

1145 

val 

Asp 

Leu 

Gly 

Asp 

1150 

lie 

Ser 

Gly 

lie 

Asn 

1155 

Ala 

Ser 

Val 

Val 

Asn 

1160 

lie 

Gin 

Lys 

Glu 

lie 

1165 

Asp 

Arg 

Leu 

Asn 

Glu 

1170 

Val 

Ala 

Lys 

Asn 

Leu 

1175 

Asn 

Glu 

Ser 

Leu 

lie 

1180 

Asp 

Leu 

Gin 

Glu 

Leu 

1185 

Gly 

Lys 

Tyr 

Glu 

Gin 

1190 

Tyr 

lie 

Lys 

Trp 

Pro 

1195 

Trp 

Tyr 

Val 

Trp 

Leu 

1200 

Gly 

Phe 

lie 

Ala 

Gly 

1205 

Leu 

lie 

Ala 

lie 

val 

1210 

Met 

val 

Thr 

lie 

Leu 

1215 

Leu 

Cys 

Cys 

Met 

Thr 

1220 

Ser 

Cys 

Cys 

Ser 

Cys 

1225 

Leu 

Lys 

Gly 

Ala 

Cys 

1230 

Ser 

Cys 

Gly 

Ser 

cys 

1235 

cys 

Lys 

Phe 

Asp 

Glu 

1240 

Asp 

Asp 

Ser 

Glu 

Pro 

1245 

Val 

Leu 

Lys 

Gly 

Val 

1250 

Lys 

Leu 

His 

Tyr 

Thr 

1255 










<210> 4 
<211> 3943 
<212> DNA 

<213> CORONAVIRUS 
<400> 4 
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ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 


60 
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120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 
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atattcttgt taacaactaa 
gtggtagtga ccttgaccgg 
aacatacttc atctatgagg 
tttatttaac tcaggattta 
ttaatcatac gtttggcaac 
cagagaaatc aaatgttgtc 
agtcggtgat tattattaac 
tgtgtgacaa ccctttcttt 
tattcgataa tgcatttaat 
tttcagaaaa gtcaggtaat 
ggtttctcta tgtttataag 
gttttaacac tttgaaacct 
gagccattct tacagccttt 
attttgttgg ctatttaaag 
tcacagatgc tgttgattgt 
gctttgagat tgacaaagga 
atgttgtgag attccctaat 
ctaaattccc ttctgtctat 
actctgtgct ctacaactca 
ctaagttgaa tgatctttgc 
atgatgtaag acaaatagcg 
tgccagatga tttcatgggt 
caactggtaa ttataattat 
agagagacat atctaatgtg 
ttaattgtta ttggccatta 
aaccttacag agttgtagta 
gaccaaaatt atccactgac 
tcactggtac tggtgtgtta 
gccgtgatgt ctctgatttc 
acatttcacc ttgctctttt 
ctgaagttgc tgttctatat 
cagatcaact cacaccagct 
aagcaggctg tcttatagga 
ttggagctgg catttgtgct 


acgaacatgt ttattttctt 
tgcaccactt ttgatgatgt 
ggggtttact atcctgatga 
tttcttccat tttattctaa 
cctgtcatac cttttaagga 
cgtggttggg tttttggttc 
aattctacta atgttgttat 
gctgtttcta aacccatggg 
tgcactttcg agtacatatc 
tttaaacact tacgagagtt 
ggctatcaac ctatagatgt 
atttttaagt tgcctcttgg 
tcacctgctc aagacatttg 
ccaactacat ttatgctcaa 
tctcaaaatc cacttgctga 
atttaccaga cctctaattt 
attacaaact tgtgtccttt 
gcatgggaga gaaaaaaaat 
acattttttt caacctttaa 
ttctccaatg tctatgcaga 
ccaggacaaa ctggtgttat 
tgtgtccttg cttggaatac 
aaatataggt atcttagaca 
cctttctccc ctgatggcaa 
aatgattatg gtttttacac 
ctttcttttg aacttttaaa 
cttattaaga accagtgtgt 
actccttctt caaagagatt 
actgattccg ttcgagatcc 
sggggtgtaa gtgtaattac 
caagatgtta actgcactga 
tggcgcatat attctactgg 
gctgagcatg tcgacacttc 
agttaceata cagtttcttt 


attatttctt actctcacta 
tcaagctcct aattacactc 
aatttttaga tcagacactc 
tgttacaggg tttcatacta 
tggtatttat tttgctgcca 
taccatgaac aacaagtcac 
acgagcatgt aactttgaat 
tacacagaca catactatga 
tgatgccttt tcgcttgatg 
tgtgtttaaa aataaagatg 
agttcgtgat ctaccttctg 
tattaacatt acaaatttta 
gggcacgtca gctgcagcct 
gtatgatgaa aatggtacaa 
actcaaatgc tctgttaaga 
cagggttgtt ccctcaggag 
tggagaggtt tttaatgcta 
ttctaattgt gttgctgatt 
gtgctatggc gtttctgcca 
ttcttttgta gtcaagggag 
tgctgattat aattataaat 
taggaacatt gatgctactt 
tggcaagctt aggccctttg 
accttgcacc ccacctgctc 
cactactggc attggctacc 
tgcaccggcc acggtttgtg 
caattttaat tttaatggac 
tcaaccattt caacaatttg 
taaaacatct gaaatattag 
acctggaaca aatgcttcat 
tgtttctaca gcaatccatg 
aaacaatgta ttccagactc 
ttatgagtgc gacattccta 
attacgtagt actagccaaa 
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2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3943 


aatctattgt ggcttatact 
acaccattgc tatacctact 
ctatggctaa aacctccgta 
ctaatttgct tctccaatat 
ttgctgctga acaggatcgc 
aaaccccaac tttgaaatat 
taaagccaac taagaggtct 
atgctggctt catgaagcaa 
tttgtgcgca gaagttcaat 
ttgctgccta cactgctgct 
ctggcgctgc tcttcaaata 
gagttaccca aaatgttctc 
cgattagtca aattcaagaa 
acgttgttaa ccagaatgct 
ttggtgcaat ttcaagtgtg 
aggtacaaat tgacaggcta 
aacaactaat cagggctgct 
ctgagtgtgt tcttggacaa 
tgtccttccc acaagcagcc 
cccaggagag gaacttcacc 
ctcgtgaagg tgtttttgtg 
tttctccaca aataattact 
ttggcatcat taacaacaca 
aagagctgga caagtacttc 
caggcattaa cgcttctgtc 
ctaaaaattt aaatgaatca 
ttaaatggcc ttggtatgtt 
ttacaatctt gctttgttgc 
gtggttcttg ctgcaagttt 
tacattacac ataaacgaac 
tactgcacag ccagtaaaaa 

< 210>5 
<211> 2049 
<212> DNA 

<213> CORONAVIRUS 
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atgtctttag gtgctgatag 
aacttttcaa ttagcattac 
gattgtaata tgtacatctg 
ggtagctttt gcacacaact 
aacacacgtg aagtgttcgc 
tttggtggtt ttaatttttc 
tttattgagg acttgctctt 
tatggcgaat gcctaggtga 
gggcttacag tgttgccacc 
ctagttagtg gtactgccac 
ccttttgcta tgcaaatggc 
tatgagaacc aaaaacaaat 
tcacttacaa caacatcaac 
caagcattaa acacacttgt 
ctaaatgata tcctttcgcg 
attacaggca gacttcaaag 
gaaatcaggg cttctgctaa 
tcaaaaagag ttgacttttg 
ccgcatggtg ttgtcttcct 
acagcgccag caatttgtca 
tttaatggca cttcttggtt 
acagacaata catttgtctc 
gtttatgatc ctctgcaacc 
aaaaatcata catcaccaga 
gtcaacattc aaaaagaaat 
ctcattgacc ttcaagaatt 
tggctcggct tcattgctgg 
atgactagtt gttgcagttg 
gatgaggatg actctgagcc 
ttatggattt gtttatgaga 
ttgacaatgc ttctcctgca 


ttcaattgct tactctaata 
tacagaagta atgcctgttt 
cggagattct actgaatgtg 
aaatcgtgca ctctcaggta 
tcaagtcaaa caaatgtaca 
acaaatatta cctgaccctc 
taataaggtg acactcgctg 
tattaatgct agagatctca 
tctgctcact gatgatatga 
tgctggatgg acatttggtg 
atataggttc aatggcattg 
cgccaaccaa tttaacaagg 
tgcattgggc aagctgcaag 
taaacaactt agctctaatt 
acttgataaa gtcgaggcgg 
ccttcaaacc tatgtaacac 
tcttgctgct actaaaatgt 
tggaaagggc taccacctta 
acatgtcacg tatgtgccat 
tgaaggcaaa gcatacttcc 
tattacacag aggaacttct 
aggaaattgt gatgtcgtta 
tgagcttgac tcattcaaag 
tgttgatctt ggcgacattt 
tgaccgcctc aatgaggtcg 
gggaaaatat gagcaatata 
actaattgcc atcgtcatgg 
cctcaagggt gcatgctctt 
agttctcaag ggtgtcaaat 
ttttttactc ttggatcaat 
agt 
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<400>5 


ctcttctgga 

aaaaggtagg 

cttatcatta 

gagaaaacaa 

cagagttgtg 

gtttcaagtg 

bu 

atattcttgt 

taacaactaa 

acgaacatgt 

ttattttctt 

attatttctt 

actctcacta 

120 

gtggtagtga 

ccttgaccgg 

tgcaccactt 

ttgatgatgt 

tcaagctcct 

aattacactc 

180 

aacatacttc 

atctatgagg 

ggggtttact 

atcctgatga 

aatttttaga 

tcagacactc 

240 

tttatttaac 

tcaggattta 

tttcttccat 

tttattctaa 

tgttacaggg 

tttcatacta 

300 

ttaatcatac 

gtttggcaac 

cctgtcatac 

cttttaagga 

tggtatttat 

tttgctgcca 

360 

cagagaaatc 

aaatgttgtc 

cgtggttggg 

tttttggttc 

taccatgaac 

aacaagtcac 

420 

agtcggtgat 

tattattaac 

aattctacta 

atgttgttat 

acgagcatgt 

aactttgaat 

480 

tgtgtgacaa 

ccctttcttt 

gctgtttcta 

aacccatggg 

tacacagaca 

catactatga 

540 

tattcgataa 

tgcatttaat 

tgcactttcg 

agtacatatc 

tgatgccttt 

tcgcttgatg 

600 

tttcagaaaa 

gtcaggtaat 

tttaaacact 

tacgagagtt 

tgtgtttaaa 

aataaagatg 

660 

ggtttctcta 

tgtttataag 

ggctatcaac 

ctatagatgt 

agttcgtgat 

ctaccttctg^ 

720 

gttttaacac 

tttgaaacct 

atttttaagt 

tgcctcttgg 

tattaacatt 

acaaatttta 

780 

gagccattct 

tacagccttt 

tcacctgctc 

aagacatttg 

gggcacgtca 

gctgcagcct 

840 

attttgttgg 

ctatttaaag 

ccaactacat 

ttatgctcaa 

gtatgatgaa 

aatggtacaa 

900 

tcacagatgc 

tgttgattgt 

tctcaaaatc 

cacttgctga 

actcaaatgc 

tctgttaaga 

960 

gctttgagat 

tgacaaagga 

atttaccaga 

cctctaattt 

cagggttgtt 

ccctcaggag 

1020 

atgttgtgag 

attccctaat 

attacaaact 

tgtgtccttt 

tggagaggtt 

tttaatgcta 

1080 

ctaaattccc 

ttctgtctat 

gcatgggaga 

gaaaaaaaat 

ttctaattgt 

gttgctgatt 

1140 

actctgtgct 

ctacaactca 

acattttttt 

caacctttaa 

gtgctatggc 

gtttctgcca 

1200 

ctaagttgaa 

tgatctttgc 

ttctccaatg 

tctatgcaga 

ttcttttgta 

gtcaagggag 

1260 

atgatgtaag 

acaaatagcg 

ccaggacaaa 

ctggtgttat 

tgctgattat 

aattataaat 

1320 

tgccagatga 

tttcatgggt 

tgtgtccttg 

cttggaatac 

taggaacatt 

gatgctactt 

1380 

caactggtaa 

ttataattat 

aaatataggt 

atcttagaca 

tggcaagctt 

aggccctttg 

1440 

agagagacat 

atctaatgtg 

cctttctccc 

ctgatggcaa 

accttgcacc 

ccacctgctc 

1500 

ttaattgtta 

ttggccatta 

aatgattatg 

gtttttacac 

cactactggc 

attggctacc 

1560 

aaccttacag 

agttgtagta 

ctttcttttg 

aacttttaaa 

tgcaccggcc 

acggtttgtg 

1620 

gaccaaaatt 

atccactgac 

cttattaaga 

accagtgtgt 

caattttaat 

tttaatggac 

1680 

tcactggtac 

tggtgtgtta 

actccttctt 

caaagagatt 

tcaaccattt 

caacaatttg 

1740 

gccgtgatgt 

ctctgatttc 

actgattccg 

ttcgagatcc 

taaaacatct 

gaaatattag 

1800 

acatttcacc 

ttgctctttt 

gggggtgtaa 

gtgtaattac 

acctggaaca 

aatgcttcat 

1860 
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1920 

1980 

2040 

2049 

60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 
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ctgaagttgc tgttctatat caagatgtta 
cagatcaact cacaccagct tggcgcatat 
aagcaggctg tcttatagga gctgagcatg 
ttggagctg 

< 210>6 

<211> 2027 

<212> DNA 

<213> CORONAVIRUS 

<400> 6 

catgcagatc aactcacacc agcttggcgc 
actcaagcag gctgtcttat aggagctgag 
cctattggag ctggcatttg tgctagttac 
caaaaatcta ttgtggctta tactatgtct 
aataacacca ttgctatacc tactaacttt 
gtttctatgg ctaaaacctc cgtagattgt 
tgtgctaatt tgcttctcca atatggtagc 
ggtattgctg ctgaacagga tcgcaacaca 
tacaaaaccc caactttgaa atattttggt 
cctctaaagc caactaagag gtcttttatt 
gctgatgctg gcttcatgaa gcaatatggc 
ctcatttgtg cgcagaagtt caatgggctt 
atgattgctg cctacactgc tgctctagtt 
ggtgctggcg ctgctcttca aatacctttt 
attggagtta cccaaaatgt tctctatgag 
aaggcgatta gtcaaattca agaatcactt 
caagacgttg ttaaccagaa tgctcaagca 
aattttggtg caatttcaag tgtgctaaat 
gcggaggtac aaattgacag gttaattaca 
acacaacaac taatcagggc tgctgaaatc 
atgtctgagt gtgttcttgg acaatcaaaa 
cttatgtcct tcccacaagc agccccgcat 
ccatcccagg agaggaactt caccacagcg 
ttccctcgtg aaggtgtttt tgtgtttaat 


actgcactga tgtttctaca gcaatccatg 
attctactgg aaacaatgta ttccagactc 
tcgacacttc ttatgagtgc gacattccta 


atatattcta ctggaaacaa tgtattccag 
catgtcgaca cttcttatga gtgcgacatt 
catacagttt ctttattacg tagtactagc 
ttaggtgctg atagttcaat tgcttactct 
tcaattagca ttactacaga agtaatgcct 
aatatgtaca tctgcggaga ttctactgaa 
ttttgcacac aactaaatcg tgcactctca 
cgtgaagtgt tcgctcaagt caaacaaatg 
ggttttaatt tttcacaaat attacctgac 
gaggacttgc tctttaataa ggtgacactc 
gaatgcctag gtgatattaa tgctagagat 
acagtgttgc cacctctgct cactgatgat 
agtggtactg ccactgctgg atggacattt 
gctatgcaaa tggcatatag gttcaatggc 
aaccaaaaac aaatcgccaa ccaatttaac 
acaacaacat caactgcatt gggcaagctg 
ttaaacacac ttgttaaaca acttagctct 
gatatccttt cgcgacttga taaagtcgag 
ggcagacttc aaagccttca aacctatgta 
agggcttctg ctaatcttgc tgctactaaa 
agagttgact tttgtggaaa gggctaccac 
ggtgttgtct tcctacatgt cacgtatgtg 
ccagcaattt gtcatgaagg caaagcatac 
ggcacttctt ggtttattac acagaggaac 
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1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2027 

60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 
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ttcttttctc cacaaataat 
gttattggcg tcattaacaa 
aaagaagagc tggacaagta 
atttcaggca ttaacgcttc 
gtcgctaaaa atttaaatga 
tatattaaat ggccttggta 
atggttacaa tcttgctttg 
tcttgtggtt cttgctgcaa 
aaattacatt acacataaac 
caattactgc acagccagta 

< 210>7 
<211> 1096 
<212> DNA 

<213> CORONAVIRUS 
<400> 7 

tcttgctttg ttgcatgact 
cttgctgcaa gtttgatgag 
acacataaac gaacttatgg 
acagccagta aaaattgaca 
accgctacaa gcctcactcc 
ttttcagagc gctaccaaaa 
gggcttccag ttcatttgca 
gcttgtcgct gcaggtatgg 
acaatgcatc aacgcatgta 
caagaaccca ttactttatg 
ctactgtata ccatataaca 
ttcaacacca aaactcaaag 
aggtgttaaa gactatgtcg 
gtctacacaa attactacag 
gcttgttaaa gacccaccga 
taatccagca atggatccaa 
agcacaagaa agtgagtacg 
aatagttaat agcgtacttc 


tactacagac aatacatttg tctcaggaaa ttgtgatgtc 
cacagtttat gatcctctgc aacctgagct tgactcattc 
cttcaaaaat catacatcac cagatgttga tcttggcgac 
tgtcgtcaac attcaaaaag aaattgaccg cctcaatgag 
atcactcatt gaccttcaag aattgggaaa atatgagcaa 
tgtttggctc ggcttcattg ctggactaat tgccatcgtc 
ttgcatgact agttgttgca gttgcctcaa gggtgcatgc 
gtttgatgag gatgactctg agccagttct caagggtgtc 
gaacttatgg atttgtttat gagatttttt actcttggat 
aaaattgaca atgcttctcc tgcaagt 


agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 
gatgactctg agccagttct caagggtgtc aaattacatt 
atttgtttat gagatttttt actcttggat caattactgc 
atgcttctcc tgcaagtact gttcatgcta cagcaacgat 
ctttcggatg gcttgttatt ggcgttgcat ttcttgctgt 
taattgcgct caataaaaga tggcagctag ccctttataa 
atttactgct gctatttgtt accatctatt cacatctttt 
aggcgcaatt tttgtacctc tatgccttga tatattttct 
gaattattat gagatgttgg ctttgttgga agtgcaaatc 
atgccaacta ctttgtttgc tggcacacac ataactatga 
gtgtcacaga tacaattgtc gttactgaag gtgacggcat 
aagactacca aattggtggt tattctgagg ataggcactc 
ttgtacatgg ctatttcacc gaagtttact accagcttga 
acactggtat tgaaaatgct acattcttca tctttaacaa 
atgtgcaaat acacacaatc gacggctctt caggagttgc 
tttatgatga gccgacgacg actactagcg tgcctttgta 
aacttatgta ctcattcgtt tcggaagaaa caggtacgtt 
tttttcttgc tttcgtggta ttcttgctag tcacactagc 
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1096 

60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1135 
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catccttact gcgctt 

< 210 > 8 
<211> 1135 
<212> DNA 

<213> CORONAVIRUS 
<400>8 


attgccatcg tcatggttac 
aagggtgcat gctcttgtgg 
ctcaagggtg tcaaattaca 
ttactcttgg atcaattact 
ctgttcatgc tacagcaacg 
ttggcgttgc atttcttgct 
gatggcagct agccctttat 
ttaccatcta ttcacatctt 
tctatgcctt gatatatttt 
ggctttgttg gaagtgcaaa 
gctggcacac acataactat 
tcgttactga aggtgacggc 
gttattctga ggataggcac 
ccgaagttta ctaccagctt 
ctacattctt catctttaac 
tcgacggctc ttcaggagtt 
cgactactag cgtgcctttg 
tttcggaaga aacaggtacg 
tattcttgct agtcacacta 

<210> 9 
<211> 1096 
<212> DNA 

<213> CORONAVIRUS 

< 220 > 

<221> CDS 
<222> (137)..(958) 

<223> 

<400> 9 


aatcttgctt tgttgcatga 
ttcttgctgc aagtttgatg 
ttacacataa acgaacttat 
gcacagccag taaaaattga 
ataccgctac aagcctcact 
gtttttcaga gcgctaccaa 
aagggcttcc agttcatttg 
ttgcttgtcg ctgcaggtat 
ctacaatgca tcaacgcatg 
tccaagaacc cattacttta 
gactactgta taccatataa 
atttcaacac caaaactcaa 
tcaggtgtta aagactatgt 
gagtctacac aaattactac 
aagcttgtta aagacccacc 
gctaatccag caatggatcc 
taagcacaag aaagtgagta 
ttaatagtta atagcgtact 
gccatcctta ctgcgcttcg 


ctagttgttg cagttgcctc 
aggatgactc tgagccagtt 
ggatttgttt atgagatttt 
caatgcttct cctgcaagta 
ccctttcgga tggcttgtta 
aataattgcg ctcaataaaa 
caatttactg ctgctatttg 
ggaggcgcaa tttttgtacc 
tagaattatt atgagatgtt 
tgatgccaac tactttgttt 
cagtgtcaca gatacaattg 
agaagactac caaattggtg 
cgttgtacat ggctatttca 
agacactggt attgaaaatg 
gaatgtgcaa atacacacaa 
aatttatgat gagccgacga 
cgaacttatg tactcattcg 
tctttttctt gctttcgtgg 
attgtgtgcg tactg 
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60 

120 

172 

220 

268 

316 

364 

412 

460 

508 

556 

604 

652 

700 

748 

796 

844 
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tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 

cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 

acacataaac gaactt atg gat ttg ttt atg aga ttt ttt act ctt gqa tea 

Met Asp Leu Phe Met Arg phe Phe Thr Leu Gly Ser 
15 10 


att 

act 

gca 

cag 

cca 

gta 

aaa 

att 

gac 

aat 

get 

tet 

cct 

gca 

agt 

act 

He 

Thr 

Ala 

Gin 

Pro 

val 

Lys 

lie 

Asp 

Asn 

Ala 

Ser 

Pro 

Ala 

Ser 

Thr 



15 




20 




25 




gtt 

cat 

get 

aca 

gca 

aeg 

ata 

ccg 

eta 

caa 

gcc 

tea 

etc 

cct 

ttc 

gga 

val 

His 

Ala 

Thr 

Ala 

Thr 

lie 

Pro 

Leu 

Gin 

Ala 

Ser 

Leu 

Pro 

Phe 

Gly 


30 





35 





40 





tgg 

ctt 

gtt 

att 

ggc 

gtt 

gca 

ttt 

ctt 

get 

gtt 

ttt 

cag 

age 

get 

acc 

Trp 

Leu 

val 

lie 

Gly 

val 

Ala 

Phe 

Leu 

Ala 

val 

Phe 

Gin 

Ser 

Ala 

Thr 

45 





50 





55 





60 

aaa 

ata 

att 

geg 

etc 

aat 

aaa 

aga 

tgg 

cag 

eta 

gcc 

ctt 

tat 

aag 

ggc 

Lys 

lie 

lie 

Al a 

Leu 

Asn 

Lys 

Arg 

Trp 

Gin 

Leu 

Ala 

Leu 

Tyr 

Lys 

Gly 





65 





70 




75 


ttc 

cag 

ttc 

att 

tgc 

aat 

tta 

ctg 

ctg 

eta 

ttt 

gtt 

acc 

ate 

tat 

tea 

Phe 

Gin 

Phe 

lie 

Cys 

Asn 

Leu 

Leu 

Leu 

Leu 

Phe 

val 

Thr 

lie 

Tyr 

ser 




80 




85 





90 


cat 

ctt 

ttg 

ctt 

gtc 

get 

gca 

ggt 

atg 

gag 

geg 

caa 

ttt 

ttg 

tac 

etc 

Hi s 

Leu 

Leu 

Leu 

val 

Ala 

Ala 

Gly 

Met 

Glu 

Ala 

Gin 

Phe 

Leu 

Tyr 

Leu 



95 





100 





105 



tat 

gcc 

ttg 

ata 

tat 

ttt 

eta 

caa 

tgc 

ate 

aac 

gca 

tgt 

aga 

att 

att 

Tyr 

Ala 

110 

Leu 

lie 

Tyr 

Phe 

Leu 

115 

Gin 

cys 

lie 

Asn 

Ala 

120 

Cys 

Arg 

lie 

lie 

atg 

aga 

tgt 

tgg 

ctt 

tgt 

tgg 

aag 

tgc 

aaa 

tcc 

aag 

aac 

cca 

tta 

ctt 

Met 

Arg 

Cys 

Trp 

Leu 

Cys 

Trp 

Lys 

cys 

Lys 

ser 

Lys 

Asn 

Pro 

Leu 

Leu 

125 





130 




135 




140 

tat 

gat 

gcc 

aac 

tac 

ttt 

gtt 

tgc 

tgg 

cac 

aca 

cat 

aac 

tat 

gac 

tac 

Tyr 

Asp 

Ala 

Asn 

Tyr 

Phe 

val 

Cys 

Trp 

Hi s 

Thr 

His 

Asn 

Tyr 

Asp 

Tyr 





145 





150 




155 

tgt 

ata 

cca 

tat 

aac 

agt 

gtc 

aca 

gat 

aca 

att 

gtc 

gtt 

act 

gaa 

ggt 

Cys 

lie 

Pro 

Tyr 

Asn 

Ser 

val 

Thr 

Asp 

Thr 

lie 

Val 

Val 

Thr 

Glu 

Gly 




160 





165 





170 



gac 

ggc 

att 

tea 

aca 

cca 

aaa 

etc 

aaa 

gaa 

gac 

tac 

caa 

att 

ggt 

ggt 

Asp 

Gly 

lie 

Ser 

Thr 

Pro 

Lys 

Leu 

Lys 

Glu 

Asp 

Tyr 

Gin 

lie 

Gly 

Gly 



175 





180 


185 




tat 

tet 

gag 

gat 

agg 

cac 

tea 

ggt 

gtt 

aaa 

gac 

tat 

gtc 

gtt 

gta 

cat 

Tyr 

Ser 

Glu 

Asp 

Arg 

His 

Ser 

Gly 

val 

Lys 

Asp 

Tyr 

val 

val 

val 

His 


190 





195 



200 





ggc 

tat 

ttc 

acc 

gaa 

gtt 

tac 

tac 

cag 

ctt 

gag 

tet 

aca 

caa 

att 

act 

Gly 

Tyr 

Phe 

Thr 

Glu 

Val 

Tyr 

Tyr 

Gin 

Leu 

Glu 

ser 

Thr 

Gin 

lie 

Thr 

205 





210 



215 





220 

aca 

gac 

act 

ggt 

att 

gaa 

aat 

get 

aca 

ttc 

ttc 

ate 

ttt 

aac 

aag 

ctt 
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Thr Asp Thr Gly lie Glu Asn Ala Thr Phe Phe lie Phe Asn Lys Leu 
225 230 235 

gtt aaa gac cca ccg aat gtg caa ata cac aca ate gac ggc tet tea 

val Lys Asp Pro Pro Asn val Gin lie His Thr lie Asp Gly Ser ser 

240 245 250 

gga gtt get aat cca gca atg gat cca att tat gat gag ccg aeg aeg 

Gly Val Ala Asn Pro Ala Met Asp Pro lie Tyr Asp Glu Pro Thr Thr 

255 260 265 

act act age gtg cct ttg taagcacaag aaagtgagta egaaettatg 
Thr Thr Ser Val Pro Leu 
270 


892 

940 

988 


tactcattcg ttteggaaga aacaggtacg ttaatagtta atagcgtact tctttttctt 1048 
gctttcgtgg tattettget agtcacacta gccatcctta ctgcgctt 1096 


< 210 > 10 
<211> 274 
<212> PRT 

<213> CORONAVIRUS 
<400> 10 


Met 

Asp 

Leu 

Phe 

Met 

Arg 

Phe 

Phe 

Thr 

Leu 

Gly 

Ser 

lie 

Thr 

Ala 

Gin 

1 



5 




10 





15 


Pro 

val 

Lys 

lie 

Asp 

Asn 

Ala 

Ser 

Pro 

Ala 

Ser 

Thr 

val 

Hi s 

Ala 

Thr 



20 




25 





30 



Ala 

Thr 

lie 

Pro 

Leu 

Gin 

Ala 

Ser 

Leu 

Pro 

Phe 

Gly 

Trp 

Leu 

Val 

lie 



35 





40 




45 




Gly 

Val 

Ala 

Phe 

Leu 

Ala 

Val 

Phe 

Gin 

Ser 

Ala 

Thr 

Lys 

lie 

lie 

Ala 

50 





55 





60 




Leu 

65 

Asn 

Lys 

Arg 

Trp 

Gin 

70 

Leu 

Ala 

Leu 

Tyr 

Lys 

75 

Gly 

Phe 

Gin 

Phe 

lie 

80 

cys 

Asn 

Leu 

Leu 

Leu 

Leu 

Phe 

val 

Thr 

lie 

Tyr 

Ser 

His 

Leu 

Leu 

Leu 




85 





90 




95 


Val 

Ala 

Ala 

Gly 

Met 

Glu 

Ala 

Gin 

Phe 

Leu 

Tyr 

Leu 

Tyr 

Ala 

Leu 

lie 




100 





105 



110 



Tyr 

Phe 

Leu 

Gin 

cys 

lie 

Asn 

Ala 

cys 

Arg 

lie 

lie 

Met 

Arg 

Cys 

Trp 



115 




120 





125 


Leu 

Cys 

Trp 

Lys 

Cys 

Lys 

Ser 

Lys 

Asn 

Pro 

Leu 

Leu 

Tyr 

Asp 

Ala 

Asn 


130 


135 




140 
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60 

120 

180 

240 

300 

360 
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Tyr 

phe 

Val 

cys 

Trp 

His 

Thr 

His 

Asn 

Tyr 

Asp 

Tyr 

cys 

lie 

Pro 

Tyr 

145 





150 





155 




160 

Asn 

Ser 

Val 

Thr 

Asp 

Thr 

lie 

val 

val 

Thr 

Glu 

Gly 

ASP 

Gly 

lie 

Ser 





165 





170 


175 


Thr 

pro 

Lys 

Leu 

180 

Lys 

Glu 

Asp 

Tyr 

Gin 

185 

lie 

Gly 

Gly 

Tyr 

Ser 

190 

Glu 

Asp 

Arg 

His 

Ser 

Gly 

Val 

Lys 

Asp 

Tyr 

val 

Val 

Val 

His 

Gly 

Tyr 

Phe 

Thr 


195 


200 





205 



Glu 

val 

Tyr 

Tyr 

Gin 

Leu 

Glu 

Ser 

Thr 

Gin 

lie 

Thr 

Thr 

Asp 

Thr 

Gly 


210 



215 





220 



lie 

Glu 

Asn 

Ala 

Thr 

Phe 

Phe 

lie 

Phe 

Asn 

Lys 

Leu 

val 

Lys 

Asp 

Pro 

225 





230 





235 



240 

Pro 

Asn 

Val 

Gin 

lie 

His 

Thr 

lie 

Asp 

Gly 

Ser 

ser 

Gly 

val 

Ala 

Asn 





245 




250 




255 


Pro 

Ala 

Met 

Asp 

Pro 

lie 

Tyr 

ASP 

Glu 

Pro 

Thr 

Thr 

Thr 

Thr 

ser 

val 




260 



265 





270 




Pro Leu 

< 210 > 11 
<211> 1096 
<212> DNA 

<213> CORONAVIRUS 

< 220 > 

<221> CDS 
<222> (558)..(1019) 

<223> 

<400> 11 

tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 
cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 
acacataaac gaacttatgg atttgtttat gagatttttt actcttggat caattactgc 
acagccagta aaaattgaca atgcttctcc tgcaagtact gttcatgcta cagcaacgat 
accgctacaa gcctcactcc ctttcggatg gcttgttatt ggcgttgcat ttcttgctgt 
ttttcagagc gctaccaaaa taattgcgct caataaaaga tggcagctag ccctttataa 
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gggcttccag ttcatttgca atttactgct gctatttgtt accatctatt cacatctttt 420 

gcttgtcgct gcaggtatgg aggcgcaatt tttgtacctc tatgccttga tatattttct 480 

acaatgcatc aacgcatgta gaattattat gagatgttgg ctttgttgga agtgcaaatc 540 

caagaaccca ttacttt atg atg cca act act ttg ttt get ggc aca cac 590 

Met Met Pro Thr Thr Leu Phe Ala Gly Thr His 

1 5 10 


ata 

act 

atg 

act 

act 

gta 

tac 

cat 

ata 

aca 

gtg 

tea 

cag 

ata 

caa 

ttg 

638 

lie 

Thr 

Met 

Thr 

Thr 

val 

Tyr 

Hi s 

lie 

Thr 

val 

ser 

Gin 

lie 

Gin 

Leu 





15 




20 





25 




teg 

tta 

ctg 

aag 

gtg 

aeg 

gca 

ttt 

caa 

cac 

caa 

aac 

tea 

aag 

aag 

act 

686 

ser 

Leu 

Leu 

Lys 

Val 

Thr 

Al a 

Phe 

Gin 

His 

Gin 

Asn 

Ser 

Lys 

Lys 

Thr 




50 




35 





40 



acc 

aaa 

ttg 

gtg 

gtt 

att 

ctg 

agg 

ata 

ggc 

act 

cag 

gtg 

tta 

aag 

act 

734 

Thr 

Lys 

Leu 

val 

Val 

lie 

Leu 

Arg 

lie 

Gly 

Thr 

Gin 

val 

Leu 

Lys 

Thr 



45 





50 



55 





atg 

teg 

ttg 

tac 

atg 

get 

att 

tea 

ccg 

aag 

ttt 

act 

acc 

age 

ttg 

agt 

782 

Met 

Ser 

Leu 

Tyr 

Met 

Ala 

lie 

Ser 

Pro 

Lys 

Phe 

Thr 

Thr 

Ser 

Leu 

Ser 


60 




65 




70 





75 


eta 

cac 

aaa 

tta 

eta 

cag 

aca 

ctg 

gta 

ttg 

aaa 

atg 

eta 

cat 

tet 

tea 

830 

Leu 

Hi s 

Lys 

Leu 

Leu 

Gin 

Thr 

Leu 

val 

Leu 

Lys 

Met 

Leu 

Hi s 

Ser 

Ser 





80 





85 




90 

- 


tet 

tta 

aca 

age 

ttg 

tta 

aag 

acc 

cac 

ega 

atg 

tgc 

aaa 

tac 

aca 

caa 

878 

Ser 

Leu 

Thr 

ser 

Leu 

Leu 

Lys 

Thr 

Hi s 

Arg 

Met 

cys 

Lys 

Tyr 

Thr 

Gin 





95 




100 


105 




teg 

aeg 

get 

ett 

cag 

gag 

ttg 

eta 

ate 

cag 

caa 

tgg 

ate 

caa 

ttt 

atg 

926 

Ser 

Thr 

Ala 

Leu 

Gin 

Glu 

Leu 

Leu 

lie 

Gin 

Gin 

Trp 

lie 

Gin 

Phe 

Met 




110 





115 




120 





atg 

age 

ega 

ega 

ega 

eta 

eta 

geg 

tgc 

ett 

tgt 

aag 

cac 

aag 

aaa 

gtg 

974 

Met 

Ser 

Arg 

Arg 

Arg 

Leu 

Leu 

Al a 

cys 

Leu 

cys 

Lys 

His 

Lys 

Lys 

val 



125 




130 




135 





agt 

aeg 

aac 

tta 

tgt 

act 

cat 

teg 

ttt 

egg 

aag 

aaa 

cag 

gta 

cgt 


1019 

ser 

Thr 

Asn 

Leu 

cys 

Thr 

Hi s 

Ser 

Phe 

Arg 

Lys 

Lys 

Gin 

val 

Arg 



140 





145 




150 






taatagttaa tagegtaett ctttttcttg ctttcgtggt attettgeta gtcacactag 1079 
ccatccttac tgegett 1096 


< 210 > 12 
<211> 154 
<212> PRT 

<213> CORONAVIRUS 
<400> 12 


Met Met pro Thr Thr Leu Phe Ala Gly Thr His lie Thr Met Thr Thr 
15 10 15 
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val 

Tyr 

His 

lie 

Thr 

Val 

Ser 

Gin 

lie 

Gin 

Leu 

Ser 

Leu 

Leu 

Lys 

Val 



20 





25 





30 



Thr 

Ala 

Phe 

Gin 

His 

Gin 

Asn 

Ser 

Lys 

Lys 

Thr 

Thr 

Lys 

Leu 

val 

val 



35 





40 



45 




lie 

Leu 

Arg 

lie 

Gly 

Thr 

Gin 

val 

Leu 

Lys 

Thr 

Met 

Ser 

Leu 

Tyr 

Met 


50 



55 




60 





Ala 

lie 

Ser 

pro 

Lys 

Phe 

Thr 

Thr 

Ser 

Leu 

ser 

Leu 

Hi s 

Lys 

Leu 

Leu 

65 




70 





75 




80 

Gin 

Thr 

Leu 

val 

Leu 

Lys 

Met 

Leu 

Hi s 

Ser 

Ser 

Ser 

Leu 

Thr 

Ser 

Leu 





85 




90 





95 


Leu 

Lys 

Thr 

Hi s 

Arg 

Met 

Cys 

Lys 

Tyr 

Thr 

Gin 

Ser 

Thr 

Ala 

Leu 

Gin 



100 



105 





110 



Glu 

Leu 

Leu 

lie 

Gin 

Gin 

Trp 

lie 

Gin 

Phe 

Met 

Met 

Ser 

Arg 

Arg 

Arg 



115 




120 





125 




Leu 

Leu 

Ala 

cys 

Leu 

cys 

Lys 

Hi s 

Lys 

Lys 

val 

Ser 

Thr 

Asn 

Leu 

Cys 


130 



135 




140 





Thr 

His 

Ser 

Phe 

Arg 

Lys 

Lys 

Gin 

val 

Arg 







145 





150 












<210> 13 
<211> 332 
<212> DNA 

<213> CORONAVIRUS 

< 220 > 

<221> CDS 
<222> (36)..(263) 

<223> 

<400> 13 


tgcctttgta agcacaagaa agtgagtacg aactt atg tac tea ttc gtt teg 53 

Met Tyr Ser Phe val Ser 
1 5 


gaa 

gaa 

aca 

ggt 

aeg 

tta 

ata 

gtt 

aat 

age 

gta 

ett 

ett 

ttt 

ett 

get 

101 

Glu 

Glu 

Thr 

Gly 

Thr 

Leu 

lie 

val 

Asn 

Ser 

val 

Leu 

Leu 

Phe 

Leu 

Ala 





10 





15 





20 




ttc 

gtg 

gta 

ttc 

ttg 

eta 

gtc 

aca 

eta 

gcc 

ate 

ett 

act 

geg 

ett 

ega 

149 

Phe 

val 

val 

Phe 

Leu 

Leu 

val 

Thr 

Leu 

Ala 

lie 

Leu 

Thr 

Ala 

Leu 

Arg 
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30 
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ttg 

Leu 

tgt 

Cys 

40 

gcg 

Ala 

tac 

Tyr 

tgc 

Cys 

tgc 

Cys 

aat 

Asn 

45 

att 

lie 

gtt 

Val 

aac 

Asn 

gtg 

vat 

agt 

Ser 

50 

tta 

Leu 

gta 

val 

aaa 

Lys 

cca 

Pro 

197 

acg 

Thr 

55 

gtt 

val 

tac 

Tyr 

gtc 

val 

tac 

Tyr 

teg 

Ser 

60 

cgt 

Arg 

gtt 

Val 

aaa 

Lys 

aat 

Asn 

ctg 

Leu 

65 

aac 

Asn 

tet 

Ser 

tet 

Ser 

gaa 

Glu 

gga 

Gty 

70 

245 

gtt 

val 

cct 

Pro 

gat 

Asp 

ctt 

Leu 

ctg 

Leu 

75 

gtc 

val 

taaacgaact aactattatt attattctgt 


293 


ttggaacttt aacattgctt atcatggcag acaacggta 332 


<210> 14 
<211> 76 
<212> PRT 

<213> CORONAVIRUS 
<400> 14 


Met 

Tyr 

Ser 

Phe 

val 

Ser 

Glu 

Glu 

Thr 

Gly 

Thr 

Leu 

lie 

Val 

Asn 

Ser 

1 



5 





10 





15 


val 

Leu 

Leu 

Phe 

Leu 

Al a 

Phe 

val 

Val 

Phe 

Leu 

Leu 

val 

Thr 

Leu 

Ala 




20 





25 





30 



lie 

Leu 

Thr 

Ala 

Leu 

Arg 

Leu 

Cys 

Ala 

Tyr 

Cys 

cys 

Asn 

lie 

val 

Asn 



35 





40 


45 




val 

Ser 

Leu 

Val 

Lys 

Pro 

Thr 

val 

Tyr 

Val 

Tyr 

Ser 

Arg 

Val 

Lys 

Asn 


50 





55 



60 



Leu 

Asn 

ser 

Ser 

Glu 

Gly 

val 

Pro 

Asp 

Leu 

Leu 

val 





65 





70 




75 







<210> 15 
<211> 332 
<212> DNA 

<213> CORONAVIRUS 
<400> 15 


tgcctttgta agcacaagaa agtgagtacg aacttatgta ctcattcgtt tcggaagaaa 60 
caggtacgtt aatagttaat agcgtacttc tttttcttgc tttcgtggta ttcttgctag 120 
tcacactagc catccttact gcgcttcgat tgtgtgcgta ctgctgcaat attgttaacg 180 
tgagtttagt aaaaccaacg gtttacgtct actcgcgtgt taaaaatctg aactcttctg 240 
aaggagttcc tgatcttctg gtctaaacga actaactatt attattattc tgtttggaac 300 


tttaacattg cttatcatgg cagacaacgg ta 332 
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5b 

103 

151 

199 

247 

295 

343 

391 

439 

487 

535 


EP 1 694 829 B1 


<210> 16 
<211> 708 
<212> DNA 

<213> CORONAVIRUS 


< 220 > 

<221> CDS 
<222> (41)..(703) 
<223> 


<400> 16 


tattattatt attctgtttg gaactttaac attgcttatc atg gca gac aac ggt 

Met Ala Asp Asn Gly 
1 5 


act 

Thr 

att 

lie 

ace 

Thr 

gtt 

val 

gag 

Glu 

10 

gag 

Glu 

ctt 

Leu 

aaa 

Lys 

caa 

Gin 

etc 

Leu 

15 

ctg 

Leu 

gaa 

Glu 

caa 

Gin 

tgg 

Trp 

aac 

Asn 

20 

eta 

Leu 

gta 

val 

at a 
lie 

ggt 

Gly 

ttc 

Phe 

25 

eta 

Leu 

ttc 

Phe 

eta 

Leu 

gcc 

Ala 

tgg 

Trp 

30 

att 

lie 

atg 

Met 

tta 

Leu 

eta 

Leu 

caa 

Gin 

35 

ttt 

Phe 

gcc 

Ala 

tat 

Tyr 

tct 

Ser 

a at 
Asn 
40 

egg 

Arg 

aac 

Asn 

agg 

Arg 

ttt 

Phe 

ttg 

Leu 

45 

tac 

Tyr 

ata 

lie 

ata 

lie 

aag 

Lys 

ctt 

Leu 

50 

gtt 

val 

ttc 

Phe 

etc 

Leu 

tgg 

Trp 

etc 

Leu 

55 

ttg 

Leu 

tgg 

Trp 

cca 

Pro 

gta 

Val 

aca 

Thr 

60 

ctt 

Leu 

get 

Ala 

tgt 

cys 

ttt 

Phe 

gtg 

Val 

65 

ctt 

Leu 

get 

Ala 

get 

Ala 

gtg 

val 

tac 

Tyr 

70 

aga 

Arg 

att 

lie 

aat 

Asn 

tgg 

Trp 

gtg 

Val 

75 

act 

Thr 

gqc 

Gly 

ggg 

Gly 

att 

lie 

geg 

Ala 

80 

att 

lie 

gca 

Ala 

atg 

Met 

get 

Ala 

tgt 

cys 

85 

att 

lie 

gta 

Val 

gqc 

Gly 

ttg 

Leu 

atg 

Met 

90 

tgg 

Trp 

ctt 

Leu 

age 

Ser 

tac 

Tyr 

ttc 

Phe 

95 

gtt 

val 

get 

Ala 

tcc 

Ser 

ttc 

Phe 

agg 

Arg 

100 

ctg 

Leu 

ttt 

Phe 

get 

Ala 

cgt 

Arg 

ace 

Thr 

105 

ege 

Arg 

tea 

Ser 

atg 

Met 

tgg 

Trp 

tea 

Ser 

110 

ttc 

Phe 

aac 

Asn 

cca 

Pro 

gaa 

Glu 

aca 

Thr 

115 

aac 

Asn 

att 

lie 

ctt 

Leu 

etc 

Leu 

aat 

Asn 

120 

gtg 

Val 

cct 

Pro 

etc 

Leu 

egg 

Arg 

ggg 

Gly 

125 

aca 

Thr 

att 

lie 

gtg 

val 

acc 

Thr 

aga 

Arg 

130 

ccg 

pro 

etc 

Leu 

atg 

Met 

gaa 

Glu 

agt 

Ser 

135 

gaa 

Glu 

ctt 

Leu 

gtc 

Val 

att 

lie 

ggt 

Gly 

140 

get 

Ala 

gtg 

val 

ate 

lie 

att 

lie 

cgt 

Arg 

145 

ggt 

Gly 

cac 
Hi s 

ttg 

Leu 

ega 

Arg 

atg 

Met 

150 

gee 

Ala 

gga 

Gly 

cac 
Hi s 

tcc 

ser 

eta 

Leu 

155 

ggg 

Gly 

ege 

Arg 

tgt 

Cys 

gac 

Asp 

att 

lie 

160 

aag 

Lys 

gac 

Asp 

ctg 

Leu 

cca 

pro 

aaa 

Lys 

165 
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gag 

Glu 

ate 

lie 

act 

Thr 

gtg 

val 

get 

Ala 

170 

aca 

Thr 

tea 

Ser 

ega 

Arg 

aeg 

Thr 

ett 

Leu 

175 

tet tat tac 
ser Tyr Tyr 

aaa 

Lys 

tta 

Leu 

180 

gga 

Gly 

583 

gcg 

Ala 

teg 

ser 

cag 

Gin 

cgt 

Arg 

185 

gta 

val 

ggc 

Gly 

act 

Thr 

gat 

Asp 

tea 

Ser 

190 

ggt 

Gly 

ttt 

Phe 

get 

Ala 

gca tac 
Ala Tyr 
195 

aac 

Asn 

ege 

Arg 

631 

tac 

Tyr 

cgt 

Arg 

att 

lie 

200 

gga 

Gly 

aac 

Asn 

tat 

Tyr 

aaa 

Lys 

tta 

Leu 

205 

aat 

Asn 

aca gac 
Thr Asp 

cac 

His 

gee 

Ala 

210 

ggt 

Gly 

age 

Ser 

aac 

Asn 

679 

gac 

Asp 

aat 

Asn 

215 

att 

lie 

get 

Ala 

ttg 

Leu 

eta 

Leu 

gta 

val 

220 

cag 

Gin 

taagt 







708 


<210> 17 
< 211 > 221 
<212> PRT 

<213> CORONAVIRUS 
<400> 17 


Met 

Ala 

Asp 

Asn 

Gly 

Thr 

lie 

Thr 

Val 

Glu 

Glu 

Leu 

Lys 

Gin 

Leu 

Leu 

1 



5 





10 




15 


Glu 

Gin 

Trp 

Asn 

Leu 

val 

lie 

Gly 

Phe 

Leu 

Phe 

Leu 

Ala 

Trp 

lie 

Met 



20 




25 





30 



Leu 

Leu 

Gin 

Phe 

Ala 

Tyr 

Ser 

Asn 

Arg 

Asn 

Arg 

Phe 

Leu 

Tyr 

lie 

He 



35 




40 



45 



Lys 

Leu 

Val 

Phe 

Leu 

Trp 

Leu 

Leu 

Trp 

Pro 

Val 

Thr 

Leu 

Ala 

Cys 

Phe 

50 




55 




60 




val 

Leu 

Al a 

Ala 

Val 

Tyr 

Arg 

lie 

Asn 

Trp 

val 

Thr 

Gly 

Gly 

lie 

Ala 

65 





70 



75 



80 

lie 

Ala 

Met 

Ala 

Cys 

lie 

val 

Gly 

Leu 

Met 

Trp 

Leu 

Ser 

Tyr 

Phe 

val 





85 




90 



95 


Ala 

Ser 

Phe 

Arg 

Leu 

Phe 

Ala 

Arg 

Thr 

Arg 

Ser 

Met 

Trp 

Ser 

Phe 

Asn 




100 




105 



110 



Pro 

Glu 

Thr 

Asn 

lie 

Leu 

Leu 

Asn 

val 

Pro 

Leu 

Arg 

Gly 

Thr 

lie 

val 



115 





120 




125 




Thr 

Arg 

Pro 

Leu 

Met 

Glu 

Ser 

Glu 

Leu 

val 

lie 

Gly 

Ala 

val 

lie 

He 


130 





135 





140 





Arg 

Gly 

His 

Leu 

Arg 

Met 

Ala 

Gly 

His 

Ser 

Leu 

Gly 

Arg 

Cys 

Asp 

lie 

145 





150 




155 


160 
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Lys 

Asp 

Leu 

Pro 

Lys 

Glu 

lie 

Thr 

Val 

Ala 

Thr 

Ser 

Arg 

Thr 

Leu 

Ser 



165 





170 




175 


Tyr 

Tyr 

Lys 

Leu 

Gly 

Ala 

ser 

Gin 

Arg 

Val 

Gly 

Thr 

Asp 

Ser 

Gly 

Phe 


180 





185 



190 



Ala 

Ala 

Tyr 

195 

Asn 

Arg 

Tyr 

Arg 

lie 

200 

Gly 

Asn 

Tyr 

Lys 

Leu 

205 

Asn 

Thr 

Asp 

Hi s 

Ala 

Gly 

Ser 

Asn 

Asp 

Asn 

lie 

Ala 

Leu 

Leu 

val 

Gin 





210 



215 





220 






<210> 18 
<211> 769 
<212> DNA 

<213> CORONAVIRUS 
<400> 18 


cctgatcttc 

tggtctaaac 

gaactaacta 

ttattattat 

tctgtttgga 

actttaacat 

60 

tgcttatcat 

ggcagacaac 

ggtactatta 

ccgttgagga 

gcttaaacaa 

ctcctggaac 

120 

aatggaacct 

agtaataggt 

ttcctattcc 

tagcctggat 

tatgttacta 

caatttgcct 

180 

attctaatcg 

gaacaggttt 

ttgtacataa 

taaagcttgt 

tttcctctgg 

ctcttgtggc 

240 

cagtaacact 

tgcttgtttt 

gtgcttgctg 

ctgtctacag 

aattaattgg 

gtgactggcg 

BOO 

ggattgcgat 

tgcaatggct 

tgtattgtag 

gcttgatgtg 

gcttagctac 

ttcgttgctt 

360 

ccttcaggct 

gtttgctcgt 

acccgctcaa 

tgtggtcatt 

caacccagaa 

acaaacattc 

420 

ttctcaatgt 

gcctctccgg 

gggacaattg 

tgaccagacc 

gctcatggaa 

agtgaacttg 

480 

tcattggtgc 

tgtgatcatt 

cgtggtcact 

tgcgaatggc 

cggacactcc 

ctagggcgct 

540 

gtgacattaa 

ggacctgcca 

aaagagatca 

ctgtggctac 

atcacgaacg 

ctttcttatt 

600 

acaaattagg 

agcgtcgcag 

cgtgtaggca 

ctgattcagg 

ttttgctgca 

tacaaccgct 

660 

accgtattgg 

aaactataaa 

ttaaatacag 

accacgccgg 

tagcaacgac 

aatattgctt 

720 

tgctagtaca 

gtaagtgaca 

acagatgttt 

catcttgttg 

acttccagg 


769 


<210> 19 
<211 > 1231 
<212> DNA 

<213> CORONAVIRUS 
<400> 19 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60 
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120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1231 

60 

120 

180 

240 

300 

360 

420 

480 
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:gctagtac agtaagtgac aacagatgtt 
agagatattg attatcatta tgaggacttt 
aataagttca atagtgagac aattatttaa 
agatgatgaa gaacctatgg agttagatta 
tcctgacatt gattgtattt acatcttgcg 
gtacgactgt actactaaaa gaaccttgcc 
ttcaccctct tgctgacaat aaatttgcac 
cttgtgctga cggtactcga catacctatc 
ttttcatcag acaagaggag gttcaacaag 
ctgctctagt atttttaata ctttgcttca 
cactttaatt gacttctatt tgtgcttttt 
gcttattata ttttggtttt cactcgaaat 
ctaaacgaac atgaaacttc tcattgtttt 
cactgtagta cagcgctgtg catctaataa 
acaacactag gggtaatact tatagcactg 
cttttcatag atggcacact atggttcaaa 
aagatccagc tggtggtgcg cttatagcta 
ctgctgcatt tagagacgta cttgttgttt 
aatggacccc aatcaaacca acgtagtgcc 
tcaactgaca ataaccagaa tggaggacgc 

< 210 > 20 
<211> 1242 
<212> DNA 

<213> CORONAVIRUS 
<400> 20 

gcatacaacc gctaccgtat tggaaactat 
gacaatattg ctttgctagt acagtaagtg 
ggttacaata gcagagatat tgattatcat 
tcttgacgtt ataataagtt caatagtgag 
ttattcggag ttagatgatg aagaacctat 
aaattattct cttcctgaca ttgattgtat 
agtgtgttag aggtacgact gtactactaa 
gcaattcacc atttcaccct cttgctgaca 


tcatcttgtt gacttccagg ttacaatagc 
caggattgct atttggaatc ttgacgttat 
gcctctaact aagaagaatt attcggagtt 
tccataaaac gaacatgaaa attattctct 
agctatatca ctatcaggag tgtgttagag 
catcaggaac atacgagggc aattcaccat 
taacttgcac tagcacacac tttgcttttg 
agctgcgtgc aagatcagtt tcaccaaaac 
agctctactc gccacttttt ctcattgttg 
ccattaagag aaagacagaa tgaatgagct 
agcctttctg ctattccttg ttttaataat 
ccaggatcta gaagaacctt gtaccaaagt 
gacttgtatt tctctatgca gttgcatatg 
acctcatgtg cttgaagatc cttgtaaggt 
cttggctttg tgctctagga aaggttttac 
catgcacacc taatgttact atcaactgtc 
ggtgttggta ccttcatgaa ggtcaccaaa 
taaataaacg aacaaattaa aatgtctgat 
ccccgcatta catttggtgg acccacagat 
a 


aaattaaata cagaccacgc cggtagcaac 
acaacagatg tttcatcttg ttgacttcca 
tatgaggact ttcaggattg ctatttggaa 
acagttattt aagcctctaa ctaagaagaa 
ggagttagat tatccataaa acgaacatga 
ttacatcttg cgagctatat cactatcagg 
aagaaccttg cccatcagga acatacgagg 
ataaatttgc actaacttgc actagcacac 
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540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1242 

60 

112 

160 

208 

256 

304 
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actttgcttt tgcttgtgct 
tttcaccaaa acttttcatc 
ttctcattgt tgctgctcta 
aatgaatgag ctcactttaa 
tgttttaata atgcttatta 
ttgtaccaaa gtctaaacga 
cagttgcata tgcactgtag 
tccttgtaag gtacaacact 
gaaaggtttt accttttcat 
ctatcaactg tcaagatcca 
aaggtcacca aactgctgca 
aaaatgtctg ataatggacc 
ggacccacag attcaactga 

< 210>21 
<211> 1231 
<212> DNA 

<213> CORONAVIRUS 

< 220 > 

<221> CDS 
<222> (86)..(274) 

<223> 


gacggtactc gacataccta 
agacaagagg aggttcaaca 
gtatttttaa tactttgctt 
ttgacttcta tttgtgcttt 
tattttggtt ttcactcgaa 
acatgaaact tctcattgtt 
tacagcgctg tgcatctaat 
aggggtaata cttatagcac 
agatggcaca ctatggttca 
gctggtggtg cgcttatagc 
tttagagacg tacttgttgt 
ccaatcaaac caacgtagtg 
caataaccag aatggaggac 


tcagctgcgt gcaagatcag 
agagctctac tcgccacttt 
caccattaag agaaagacag 
ttagcctttc tgctattcct 
atccaggatc tagaagaacc 
ttgacttgta tttctctatg 
aaacctcatg tgcttgaaga 
tgcttggctt tgtgctctag 
aacatgcaca cctaatgtta 
taggtgttgg taccttcatg 
tttaaataaa cgaacgaatt 
ccccccgcat tacatttggt 
gc 


<400> 21 


taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 

ttgctagtac agtaagtgac aacag atg ttt cat ctt gtt gac ttc cag gtt 

Met Phe His Leu Val Asp Phe Gin Val 
1 5 


aca 

Thr 

10 

ata 

lie 

gca 

Ala 

gag 

Glu 

ata 

lie 

ttg 

Leu 

15 

att 

lie 

ate 

lie 

att 

lie 

atg 

Met 

agg 

Arg 

20 

act 

Thr 

ttc 

Phe 

agg 

Arg 

att 

lie 

get 

Ala 

25 

att 

lie 

tgg 

Trp 

aat 

Asn 

ctt 

Leu 

gac 

Asp 

30 

gtt 

val 

ata 

lie 

ata 

lie 

agt 

ser 

tea 

Ser 

35 

ata 

lie 

gtg 

Val 

aga 

Arg 

caa 

Gin 

tta 

Leu 

40 

ttt 

Phe 

aag 

Lys 

cct 

Pro 

eta 

Leu 

act 

Thr 

45 

aag 

Lys 

aag 

Lys 

aat 

Asn 

tat 

Tyr 

teg 

Ser 

50 

gag 

Glu 

tta 

Leu 

gat gat 
Asp Asp 

gaa 

Glu 

55 

gaa 

Glu 

cct 

Pro 

atg 

gag 

tta 

gat 

tat 

cca 

taaaacgaac atgaaaatta ttctcttcct 
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Met Glu Leu Asp Tyr Pro 


60 

gacattgatt 

gtatttacat 

cttgcgagct 

atatcactat 

caggagtgtg 

ttagaggtac 

364 

gactgtacta 

ctaaaagaac 

cttgcccatc 

aggaacatac 

gagggcaatt 

caccatttca 

424 

ccctcttgct 

gacaataaat 

ttgcactaac 

ttgcactagc 

acacactttg 

cttttgcttg 

484 

tgctgacggt 

actcgacata 

cctatcagct 

gcgtgcaaga 

tcagtttcac 

caaaactttt 

544 

catcagacaa 

gaggaggttc 

aacaagagct 

ctactcgcca 

ctttttctca 

ttgttgctgc 

604 

tctagtattt 

ttaatacttt 

gcttcaccat 

taagagaaag 

acagaatgaa 

tgagctcact 

664 

ttaattgact 

tctatttgtg 

ctttttagcc 

tttctgctat 

tccttgtttt 

aataatgctt 

724 

attatatttt 

ggttttcact 

cgaaatccag 

gatctagaag 

aaccttgtac 

caaagtctaa 

784 

acgaacatga 

aacttctcat 

tgttttgact 

tgtatttctc 

tatgcagttg 

catatgcact 

844 

gtagtacagc 

gctgtgcatc 

taataaacct 

catgtgcttg 

aagatccttg 

taaggtacaa 

904 

cactaggggt 

aatacttata 

gcactgcttg 

gctttgtgct 

ctaggaaagg 

ttttaccttt 

964 

tcatagatgg 

cacactatgg 

ttcaaacatg 

cacacctaat 

gttactatca 

actgtcaaga 

1024 

tccagctggt 

ggtgcgctta 

tagctaggtg 

ttggtacctt 

catgaaggtc 

accaaactgc 

1084 

tgcatttaga 

gacgtacttg 

ttgttttaaa 

taaacgaaca 

aattaaaatg 

tctgataatg 

1144 

gaccccaatc 

aaaccaacgt 

agtgcccccc 

gcattacatt 

tggtggaccc 

acagattcaa 

1204 

ctgacaataa 

ccagaatgga 

ggacgca 




1231 


< 210 > 22 
<211> 63 
<212> PRT 

<213> CORONAVIRUS 
<400> 22 



Met 

1 

Phe 

Hi s 

Leu 

val 

5 

Asp 

Phe 

Gin 

Val 

Thr 

10 

lie 

Ala 

Glu 

lie 

Leu 

15 

lie 


lie 

lie 

Met 

Arg 

20 

Thr 

Phe 

Arg 

lie 

Ala 

25 

lie 

Trp 

Asn 

Leu 

ASP 

30 

Val 

lie 


lie 

Ser 

Ser 

35 

lie 

val 

Arg 

Gin 

Leu 

40 

Phe 

Lys 

Pro 

Leu 

Thr 

45 

Lys 

Lys 

Asn 


Tyr 

ser 

50 

Glu 

Leu 

Asp 

Asp 

Glu 

55 

Glu 

Pro 

Met 

Glu 

Leu 

60 

Asp 

Tyr 

Pro 


<210> 

23 
















<211> 

1231 
















<212> 

DNA 
















<213> 

CORONAVIRUS 
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60 

120 

180 

240 

296 

344 

392 

440 

488 

536 

584 

632 

680 

740 

800 

860 

920 
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<220 
<221> CDS 
<222> (285)..(650) 
<223> 

<400> 23 


taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 

agatgatgaa gaacctatgg agttagatta tccataaaac gaac atg aaa att att 

Met Lys lie lie 
1 


etc 

Leu 

5 

ttc 

Phe 

ctg 

Leu 

aca 

Thr 

ttg 

Leu 

att 

lie 

10 

gta 

val 

ttt 

Phe 

aca 

Thr 

tet 

Ser 

tgc 

cys 

15 

gag 

Glu 

eta 

Leu 

tat 

Tyr 

cac 

His 

tat 

Tyr 

20 

cag 

Gin 

gag 

Glu 

tgt 

Cys 

gtt 

Val 

aga 

Arg 

25 

ggt 

Gly 

aeg 

Thr 

act 

Thr 

gta 

val 

eta 

Leu 

30 

eta 

Leu 

aaa 

Lys 

gaa 

Glu 

cct 

Pro 

tgc 

cys 

35 

cca 

Pro 

tea 

Ser 

gga 

Gly 

aca 

Thr 

tac 

Tyr 

40 

gag 

Glu 

ggc 

Gly 

aat 

Asn 

tea 

Ser 

cca 

Pro 

45 

ttt 

Phe 

cac 

His 

cct 

Pro 

ett 

Leu 

get 

Ala 

50 

gac 

Asp 

aat 

Asn 

aaa 

Lys 

ttt 

Phe 

gca 

Ala 

55 

eta 

Leu 

act 

Thr 

tgc 

Cys 

act 

Thr 

age 

Ser 

60 

aca 

Thr 

cac 

His 

ttt 

Phe 

get 

Ala 

ttt 

Phe 

65 

get 

Ala 

tgt 

Cys 

get 

Ala 

gac 

Asp 

ggt 

Gly 

70 

act 

Thr 

ega 

Arg 

cat 
Hi s 

acc 

Thr 

tat 

Tyr 

75 

cag 

Gin 

ctg 

Leu 

cgt 

Arg 

gca 

Ala 

aga 

Arg 

80 

tea 

Ser 

gtt 

val 

tea 

Ser 

cca 

Pro 

aaa 

Lys 

85 

ett 

Leu 

ttc 

Phe 

ate 

lie 

aga 

Arg 

caa 

Gin 

90 

gag 

Glu 

gag 

Glu 

gtt 

val 

caa 

Gin 

caa 

Gin 

95 

gag 

Glu 

etc 

Leu 

tac 

Tyr 

teg 

ser 

cca 

Pro 

100 

ett 

Leu 

ttt 

Phe 

etc 

Leu 

att 

lie 

gtt 

val 

105 

get 

Ala 

get 

Ala 

eta 

Leu 

gta 

val 

ttt 

Phe 

110 

tta 

Leu 

at a 
lie 

ett 

Leu 

tgc 

cys 

ttc 

Phe 

115 

acc 

Thr 

att 

lie 

aag 

Lys 

aga 

Arg 

aag 

Lys 

120 

aca 

Thr 

gaa 

Glu 

tgaatgaget cactttaatt gaettetatt 



tgtgcttttt agcctttctg ctattccttg ttttaataat gcttattata ttttggtttt 
cactcgaaat ccaggatcta gaagaacctt gtaccaaagt ctaaacgaac atgaaacttc 
tcattgtttt gacttgtatt tctctatgca gttgcatatg cactgtagta cagcgctgtg 
catctaataa acctcatgtg cttgaagatc cttgtaaggt acaacactag gggtaatact 


ill 
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tatagcactg cttggctttg tgctctagga 
atggttcaaa catgcacacc taatgttact 
5 cttatagcta ggtgttggta ccttcatgaa 
cttgttgttt taaataaacg aacaaattaa 
acgtagtgcc ccccgcatta catttggtgg 
tggaggacgc a 

<210> 24 
< 211 > 122 
15 <212> PRT 

<213> CORONAVIRUS 

<400> 24 

20 


Met 

Lys 

lie 

lie 

Leu 

Phe 

Leu 

Thr 

Leu 

lie 

val 

Phe 

Thr 

ser 

cys 

Glu 

1 



5 





10 





15 


Leu 

Tyr 

Hi s 

Tyr 

Gin 

Glu 

cys 

Val 

Arg 

Gly 

Thr 

Thr 

Val 

Leu 

Leu 

Lys 



20 




25 





30 



Glu 

Pro 

Cys 

Pro 

Ser 

Gly 

Thr 

Tyr 

Glu 

Gly 

Asn 

Ser 

Pro 

Phe 

His 

Pro 



35 





40 




45 




Leu 

Ala 

ASp 

Asn 

Lys 

Phe 

Ala 

Leu 

Thr 

Cys 

Thr 

Ser 

Thr 

Hi s 

Phe 

Ala 


50 



55 




60 





Phe 

Ala 

cys 

Ala 

Asp 

Gly 

Thr 

Arg 

Hi s 

Thr 

Tyr 

Gin 

Leu 

Arg 

Ala 

Arg 

65 



70 




75 




80 

Ser 

val 

Ser 

Pro 

Lys 

Leu 

Phe 

lie 

Arg 

Gin 

Glu 

Glu 

Val 

Gin 

Gin 

Glu 





85 




90 





95 


Leu 

Tyr 

ser 

Pro 

Leu 

Phe 

Leu 

lie 

Val 

Ala 

Ala 

Leu 

Val 

Phe 

Leu 

lie 



100 





105 





110 



Leu 

cys 

Phe 

Thr 

lie 

Lys 

Arg 

Lys 

Thr 

Glu 








115 120 


<210> 25 
<211> 1231 
so <212> DNA 

<213> CORONAVIRUS 

< 220 > 

<221> CDS 

55 <222> (650)..(781) 

<223> 

<400> 25 


aaggttttac cttttcatag atggcacact 980 
atcaactgtc aagatccagc tggtggtgcg 1040 
ggtcaccaaa ctgctgcatt tagagacgta 1100 
aatgtctgat aatggacccc aatcaaacca 1160 
acccacagat tcaactgaca ataaccagaa 1220 

1231 
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taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 

agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 

tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 

gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 

ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 

cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 

ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 

ctgctctagt atttttaata ctttgcttca ccattaagag aaagacaga atg aat gag 

Met Asn Glu 
1 

etc act tta att gac ttc tat ttg tgc ttt tta gee ttt ctg eta ttc 

Leu Thr Leu lie Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe 

5 10 15 

ett gtt tta ata atg ett att ata ttt tgg ttt tea etc gaa ate cag 

Leu val Leu lie Met Leu lie lie Phe Trp Phe Ser Leu Glu lie Gin 

20 25 30 35 

gat eta gaa gaa cct tgt ace aaa gtc taaacgaaca tgaaacttct 
Asp Leu Glu Glu Pro cys Thr Lys Val 
40 

cattgttttg acttgtattt ctctatgcag ttgcatatgc actgtagtac agcgctgtgc 
atetaataaa cctcatgtgc ttgaagatcc ttgtaaggta caacactagg ggtaataett 
atagcactgc ttggctttgt getetaggaa aggttttacc ttttcataga tggcacacta 
tggttcaaac atgcacacct aatgttacta tcaactgtca agatccagct ggtggtgcgc 
ttatagetag gtgttggtac cttcatgaag gtcaccaaac tgctgcattt agagacgtac 
ttgttgtttt aaataaacga acaaattaaa atgtctgata atggacccca atcaaaccaa 
cgtagtgccc cccgcattac atttggtgga cccacagatt caactgacaa taaccagaat 
ggaggaegea 

<210> 26 
<211 >44 
<212> PRT 

<213> CORONAVIRUS 
<400> 26 
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Met Asn Glu Leu Thr Leu lie Asp Phe Tyr Leu Cys Phe Leu Ala Phe 
15 10 15 

Leu Leu Phe Leu val Leu lie Met Leu lie lie Phe Trp Phe Ser Leu 
20 25 30 

Glu lie Gin Asp Leu Glu Glu Pro Cys Thr Lys val 
35 40 

<210> 27 
<211> 1231 
<212> DNA 

<213> CORONAVIRUS 

< 220 > 

<221> CDS 
<222> (791)..(907) 

<223> 

<400> 27 

taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 
agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 
tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 
gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 
ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 
cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 
ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 
ctgctctagt atttttaata ctttgcttca ccattaagag aaagacagaa tgaatgagct 
cactttaatt gacttctatt tgtgcttttt agcctttctg ctattccttg ttttaataat 
gcttattata ttttggtttt cactcgaaat ccaggatcta gaagaacctt gtaccaaagt 
ctaaacgaac atg aaa ctt etc att gtt ttg act tgt att tet eta tgc 


114 
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Met lys Leu Leu lie val Leu Thr cys lie ser Leu cys 
1 5 10 

agt tgc ata tgc act gta gta cag cgc tgt gca tct aat aaa cct cat 
5 Ser Cys lie cys Thr val Val Gin Arg cys Ala ser Asn Lys pro His 
15 20 25 

gtg ctt gaa gat cct tgt aag gta caa cac taggggtaat acttatagca 
Val Leu Glu Asp Pro Cys Lys val Gin His 
30 35 

10 

ctgcttggct ttgtgctcta ggaaaggttt taccttttca tagatggcac actatggttc 
aaacatgcac acctaatgtt actatcaact gtcaagatcc agctggtggt gcgcttatag 
ctaggtgttg gtaccttcat gaaggtcacc aaactgctgc atttagagac gtacttgttg 
ttttaaataa acgaacaaat taaaatgtct gataatggac cccaatcaaa ccaacgtagt 
gccccccgca ttacatttgg tggacccaca gattcaactg acaataacca gaatggagga 

cgca 

20 3 

<210> 28 
<211> 39 
<212> PRT 

25 <213> CORONAVIRUS 


<400> 28 


30 

Met 

Lys 

Leu 

Leu 

lie 

Val 

Leu 

Thr 

cys 

He 

Ser 

Leu Cys 

ser 

cys 

lie 

1 




5 




10 



15 



cys 

Thr 

Val 

val 

Gin 

Arg 

cys 

Ala 

ser 

Asn 

Lys 

Pro His 

val 

Leu 

Glu 





20 



25 



30 



35 

















Asp 

Pro 

Cys 

Lys 

Val 

Gl n 

Hi s 












35 













40 <210> 29 

<211> 1231 
<212> DNA 

<213> CORONAVIRUS 

45 <220> 

<221> CDS 
<222> (876)..(1127) 
<223> 

50 <400> 29 


55 


877 

927 

987 

1047 

1107 

1167 

1227 

1231 
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taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 

ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 

agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 

aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 

agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct 

tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag 

gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat 

ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg 

cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac 

ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg 

ctgctctagt atttttaata ctttgcttca ccattaagag aaagacagaa tgaatgagct 

cactttaatt gacttctatt tgtgcttttt agcctttctg ctattccttg ttttaataat 

gcttattata ttttggtttt cactcgaaat ccaggatcta gaagaacctt gtaccaaagt 

ctaaacgaac atgaaacttc tcattgtttt gacttgtatt tctctatgca gttgcatatg 

cactgtagta cagcgctgtg catctaataa acctc atg tgc ttg aag ate ett - 

Met Cys Leu Lys lie Leu 
1 5 


gta 

agg 

tac 

aac 

act 

agg 

ggt 

aat 

act 

tat 

age 

act 

get 

tgg 

ett 

tgt 

val 

Arg 

Tyr 

Asn 

Thr 

Arg 

Gly 

Asn 

Thr 

Tyr 

Ser 

Thr 

Al a 

Trp 

Leu 

cys 


10 




15 





20 



get 

eta 

gga 

aag 

gtt 

tta 

cct 

ttt 

cat 

aga 

tgg 

cac 

act 

atg 

gtt 

caa 

Ala 

Leu 

Gly 

Lys 

val 

Leu 

Pro 

Phe 

His 

Arg 

Trp 

Hi s 

Thr 

Met 

Val 

Gin 



25 




30 



35 




aca 

tgc 

aca 

cct 

aat 

gtt 

act 

ate 

aac 

tgt 

caa 

gat 

cca 

get 

ggt 

ggt 

Thr 

Cys 

Thr 

Pro 

Asn 

val 

Thr 

lie 

Asn 

Cys 

Gin 

Asp 

pro 

Ala 

Gly 

Gly 


40 





45 




50 





geg 

ett 

ata 

get 

agg 

tgt 

tgg 

tac 

ett 

cat 

gaa 

ggt 

cac 

caa 

act 

get 

Ala 

Leu 

lie 

Ala 

Arg 

cys 

Trp 

Tyr 

Leu 

His 

Glu 

Gly 

His 

Gin 

Thr 

Ala 

55 




60 



65 





70 

gca 

ttt 

aga 

gac 

gta 

ett 

gtt 

gtt 

tta 

aat 

aaa 

ega 

aca 

aat 



Ala 

Phe 

Arg 

Asp 

val 

Leu 

val 

val 

Leu 

Asn 

Lys 

Arg 

Thr 

Asn 




75 80 

taaaatgtct gataatggac cccaatcaaa ccaacgtagt gccccccgca ttacatttgg 
tggacccaca gattcaactg acaataacca gaatggagga egea 


<210> 30 
<211> 84 
<212> PRT 

<213> CORONAVIRUS 
<400> 30 
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Met 

cys 

Leu 

Lys 

lie 

Leu 

val 

Arg 

Tyr 

Asn 

Thr 

Arg 

Gly 

Asn 

Thr 

Tyr 

1 


5 





10 




15 


ser 

Thr 

Ala 

Trp 

Leu 

cys 

Ala 

Leu 

Gly 

Lys 

Val 

Leu 

pro 

Phe 

Hi s 

Arg 




20 





25 




30 


Trp 

Hi s 

Thr 

Met 

val 

Gin 

Thr 

cys 

Thr 

Pro 

Asn 

val 

Thr 

lie 

Asn 

Cys 


35 





40 





45 



Gin 

Asp 

Pro 

Ala 

Gly 

Gly 

Ala 

Leu 

lie 

Ala 

Arg 

cys 

Trp 

Tyr 

Leu 

Hi s 


50 





55 




60 





Glu 

Gly 

Hi s 

Gin 

Thr 

a! a 

Ala 

Phe 

Arg 

Asp 

val 

Leu 

val 

val 

Leu 

Asn 

65 





70 



75 





80 


Lys Arg Thr Asn 

<210>31 

<211 > 21221 

<212> DNA 

<213> CORONAVIRUS 
<400>31 

atggagagcc ttgttcttgg tgtcaacgag aaaacacacg tccaactcag tttgcctgtc 
cttcaggtta gagacgtgct agtgcgtggc ttcggggact ctgtggaaga ggccctatcg 
gaggcacgtg aacacctcaa aaatggcact tgtggtctag tagagctgga aaaaggcgta 
ctgccccagc ttgaacagcc ctatgtgttc attaaacgtt ctgatgcctt aagcaccaat 
cacggccaca aggtcgttga gctggttgca gaaatggacg gcattcagta cggtcgtagc 
ggtataacac tgggagtact cgtgccacat gtgggcgaaa ccccaattgc ataccgcaat 
gttcttcttc gtaagaacgg taataaggga gccggtggtc atagctatgg catcgatcta 
aagtcttatg acttaggtga cgagcttggc actgatccca ttgaagatta tgaacaaaac 
tggaacacta agcatggcag tggtgcactc cgtgaactca ctcgtgagct caatggaggt 
gcagtcactc gctatgtcga caacaatttc tgtggcccag atgggtaccc tcttgattgc 
atcaaagatt ttctcgcacg cgcgggcaag tcaatgtgca ctctttccga acaacttgat 
tacatcgagt cgaagagagg tgtctactgc tgccgtgacc atgagcatga aattgcctgg 
ttcactgagc gctctgataa gagctacgag caccagacac ccttcgaaat taagagtgcc 
aagaaatttg acactttcaa aggggaatgc ccaaagtttg tgtttcctct taactcaaaa 
gtcaaagtca ttcaaccacg tgttgaaaag aaaaagactg agggtttcat ggggcgtata 
cgctctgtgt accctgttgc atctccacag gagtgtaaca atatgcactt gtctaccttg 
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1260 

1320 
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atgaaatgta atcattgcga tgaagtttca tggcagacgt gcgactttct gaaagccact 
tgtgaacatt gtggcactga aaatttagtt attgaaggac ctactacatg tgggtaccta 
cctactaatg ctgtagtgaa aatgccatgt cctgcctgtc aagacccaga gattggacct 
gagcatagtg ttgcagatta tcacaaccac tcaaacattg aaactcgact ccgcaaggga 
ggtaggacta gatgttttgg aggctgtgtg tttgcctatg ttggctgcta taataagcgt 
gcctactggg ttcctcgtgc tagtgctgat attggctcag gccatactgg cattactggt 
gacaatgtgg agaccttgaa tgaggatctc cttgagatac tgagtcgtga acgtgttaac 
attaacattg ttggcgattt tcatttgaat gaagaggttg ccatcatttt ggcatctttc 
tctgcttcta caagtgcctt tattgacact ataaagagtc ttgattacaa gtctttcaaa 
accattgttg agtcctgcgg taactataaa gttaccaagg gaaagcccgt aaaaggtgct 
tggaacattg gacaacagag atcagtttta acaccactgt gtggttttcc ctcacaggct 
gctggtgtta tcagatcaat ttttgcgcgc acacttgatg cagcaaacca ctcaattcct 
gatttgcaaa gagcagctgt caccatactt gatggtattt ctgaacagtc attacgtctt 
gtcgacgcca tggtttatac ttcagacctg ctcaccaaca gtgtcattat tatggcatat 
gtaactggtg gtcttgtaca acagacttct cagtggttgt ctaatctttt gggcactact 
gttgaaaaac tcaggcctat ctttgaatgg attgaggcga aacttagtgc aggagttgaa 
tttctcaagg atgcttggga gattctcaaa tttctcatta caggtgtttt tgacatcgtc 
aagggtcaaa tacaggttgc ttcagataac atcaaggatt gtgtaaaatg cttcattgat 
gttgttaaca aggcactcga aatgtgcatt gatcaagtca ctatcgctgg cgcaaagttg 
cgatcactca acttaggtga agtcttcatc gctcaaagca agggacttta ccgtcagtgt 
atacgtggca aggagcagct gcaactactc atgcctctta aggcaccaaa agaagtaacc 
tttcttgaag gtgattcaca tgacacagta cttacctctg aggaggttgt tctcaagaac 
ggtgaactcg aagcactcga gacgcccgtt gatagcttca caaatggagc tatcgttggc 
acaccagtct gtgtaaatgg cctcatgctc ttagagatta aggacaaaga acaatactgc 
gcattgtctc ctggtttact ggctacaaac aatgtctttc gcttaaaagg gggtgcacca 
attaaaggtg taacctttgg agaagatact gtttgggaag ttcaaggtta caagaatgtg 
agaatcacat ttgagcttga tgaacgtgtt gacaaagtgc ttaatgaaaa gtgctctgtc 
tacactgttg aatccggtac cgaagttact gagtttgcat gtgttgtagc agaggctgtt 
gtgaagactt tacaaccagt ttctgatctc cttaccaaca tgggtattga tcttgatgag 
tggagtgtag ctacattcta cttatttgat gatgctggtg aagaaaactt ttcatcacgt 
atgtattgtt ccttttaccc tccagatgag gaagaagagg acgatgcaga gtgtgaggaa 
gaagaaattg atgaaacctg tgaacatgag tacggtacag aggatgatta tcaaggtctc 
cctctggaat ttggtgcctc agctgaaaca gttcgagttg aggaagaaga agaggaagac 
tggctggatg atactactga gcaatcagag attgagccag aaccagaacc tacacctgaa 
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gaaccagtta atcagtttac 
gttgacatcg ttaaggaggc 
atacacctga aacatggtgg 
atgcaaaagg agagtgatga 
tgtttgcttt ctggacataa 
aatgcaggtg aggacatcca 
atcttacttg caccattgtt 
caagtgtgcg tgcagacggt 
tatgagcagg ttgtcatgga 
caagaggagc caccaaacac 
cctgtcgatg tgaagccaaa 
gaaactaagt ttcttaccaa 
catgattctc agaacatgct 
tacatggtag gtgatgttat 
aaggctggtg gcactactga 
tatataacca cgtaccctgg 
gctcttaaga aatgcaaatc 
gaagagattc taggaactgt 
acaagaaaat taatgcctat 
aagtataaag gaattaaaat 
tatactagta aagagcctgt 
cttgtcacaa tgccaattgg 
tgtatgcgtt ctcttaaagc 
acatataatg gatacctcac 
gtttctttgg ctggctctta 
gttgaatttc ttaagcgtgg 
tttcatcttg acggtgaggt 
gaggttaaga ctataaaagt 
gtggatatgt ctatgacata 
gttacaaaaa ttaaacctca 
gatgacacac tacgtagtga 
ggtaggtaca tgtctgcttt 
ttaacttcaa ttaaatgggc 
caacagcttg aagtcaaatt 


tggttattta aaacttactg 
acaaagtgct aatcctatgg 
tggtgtagca ggtgcactca 
ttacattaag ctaaatggcc 
tcttgctaag aagtgtctgc 
gcttcttaag gcagcatatg 
gtcagcaggc atatttggtg 
tcgtacacag gtttatattg 
ttatcttgat aacctgaagc 
agaagattcc aaaactgagg 
aattaaggcc tgcattgatg 
taagttactc ttgtttgctg 
tagaggtgaa gatatgtctt 
cactagtggt gatatcactt 
gatgctctca agagctttga 
acaaggatgt gctggttata 
tgcattttat gtactacctt 
atcctggaat ttgagagaaa 
atgcatggat gttagagcca 
tcaagagggc atcgttgact 
agcttctatt attacgaagc 
ttatgtgaca catggtttta 
tcctgccgta gtgtcagtat 
ttcgtcatca aagacatctg 
cagagattgg tcctattcag 
tgacaaaatt gtgtaccaca 
tctttcactt gacaaactaa 
gttcacaact gtggacaaca 
tggacagcag tttggtccaa 
tgtaaatcat gagggtaaga 
agctttcgag tactaccata 
aaaccacaca aagaaatgga 
tgataacaat tgttatttgt 
caatgcacca gcacttcaag 


acaatgttgc cattaaatgt 
tgattgtaaa tgctgctaac 
acaaggcaac caatggtgcc 
ctcttacagt aggagggtct 
atgttgttgg acctaaccta 
aaaatttcaa ttcacaggac 
ctaaaccact tcagtcttta 
cagtcaatga caaagctctt 
ctagagtgga agcacctaaa 
agaaatctgt cgtacagaag 
aggttaccac aacactggaa 
atatcaatgg taagctttac 
tccttgagaa ggatgcacct 
gtgttgtaat accctccaaa 
agaaagtgcc agttgatgag 
cacttgagga agctaagact 
cagaagcacc taatgctaag 
tgcttgctca tgctgaagag 
taatggcaac catccaacgt 
atggtgtccg attcttcttt 
tgaactctct aaatgagccg 
atcttgaaga ggctgcgcgc 
catcaccaga tgctgttact 
aggagcactt tgtagaaaca 
gacagcgtac agagttaggt 
ctctggagag ccccgtcgag 
agagtctctt atccctgcgg 
ctaatctcca cacacagctt 
catacttgga tggtgctgat 
ctttctttgt actacctagt 
ctcttgatga gagttttctt 
aatttcctca agttggtggt 
ctagtgtttt attagcactt 
aggcttatta tagagcccgt 
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gctggtgatg ctgctaactt 
gagcttggtg atgtcagaga 
gcaaagcgag ttcttaatgt 
ggtgtagaag ctgtgatgta 
tccattccat gtgtgtgtgg 
tttgttatga tgtctgcacc 
gcgaatgagt acactggtaa 
accctctatc gtattgacgg 
actgatgttt tctacaagga 
ctcgatggag ttacttacac 
aatgcttact atacagagca 
agttttgata atttcaaact 
atgacaggct tcacaaagcc 
aatggcgatg tagtggctat 
aaattactgc ataagccaat 
aaaccaaaca cttggtgttt 
tcatttgaag ttctggcagt 
caacaaccca cctctgaaga 
tgtgacgtga aaactaccga 
gttaaagtaa cacaagagtt 
agcattacca ttaagaaacc 
actcatggta ttgctgcaat 
ccattcttag gacaagcagc 
gtgtttaaca attatatgcc 
aaaagtacca attctagaat 
aagagtgttg ctaaattatg 
tctaaattgt tcacaatcgc 
atctgtgtaa ctgctgcttt 
aatggcgtta gagaattgta 
ggttcttttc cttgcagcat 
cttgaaacca ttcaggtgac 
gccgctgagt gggttttggc 
tcagctataa tgcaggtgtt 
ctcatgtggt ttatcattag 


ttgtgcactc atactcgctt 
aactatgacc catcttctac 
ggtgtgtaaa cattgtggtc 
tatgggtact ctatcttatg 
tcgtgatgct acacaatatc 
acctgctgag tataaattac 
ctatcagtgt ggtcattaca 
agctcacctt acaaagatgt 
aacatcttac actacaacca 
agagattgaa ccaaaattgg 
gcctatagac cttgtaccaa 
cacatgttct aacacaaaat 
agcttcacga gagctatctg 
tgactataga cactattcag 
tgtttggcac attaaccagg 
acgttgtctt tggagtacaa 
agaagacaca caaggaatgg 
agtagtggaa aatcctacca 
agttgtaggc aatgtcatac 
aggtcatgag gatcttatgg 
taatgagctt tcactagcct 
taatagtgtt ccttggagta 
aattacaaca tcaaattgcg 
ttatgtgttt acattattgt 
tagagcttca ctacctacaa 
tttggatgcc ggcattaatt 
tatgtggcta ttgttgttaa 
tggtgtactc ttatctaatt 
tcttaattcg tctaacgtta 
ttgtttaagt ggattagact 
gatttcatcg tacaagctag 
atatatgttg ttcacaaaat 
ctttggctat tttgctagtc 
tattgtacaa atggcacccg 


acagtaataa aactgttggc 
agcatgctaa tttggaatct 
agaaaactac taccttaacg 
ataatcttaa gacaggtgtt 
tagtacaaca agagtcttct 
agcaaggtac attcttatgt 
ctcatataac tgctaaggag 
cagagtacaa aggaccagtg 
tcaagcctgt gtcgtataaa 
atgggtatta taaaaaggat 
ctcaaccatt accaaatgcg 
ttgctgatga tttaaatcaa 
tcacattctt cccagacttg 
cgagtttcaa gaaaggtgct 
ctacaaccaa gacaacgttc 
agccagtaga tacttcaaat 
acaatcttgc ttgtgaaagt 
tacagaagga agtcatagag 
ttaaaccatc agatgaaggt 
ctgcttatgt ggaaaacaca 
taggtttaaa aacaattgcc 
aaattttggc ttatgtcaaa 
ctaagagatt agcacaacgt 
tccaattgtg tacttttact 
ctattgctaa aaatagtgtt 
atgtgaagtc acccaaattt 
gtatttgctt aggttctcta 
ttggtgctcc ttcttattgt 
ctactatgga tttctgtgaa 
cccttgattc ttatccagct 
acttgacaat tttaggtctg 
tcttttattt attaggtctt 
atttcatcag caattcttgg 
tttctgcaat ggttaggatg 
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tacatcttct ttgcttcttt 
tgcacctctt cgacttgcat 
acaactattg ttaatggcat 
ttctgcaaga ctcacaattg 
ttcattagtg atgaagttgc 
actgaccagt catcgtatat 
tactttgaca aggctggtca 
ttagacaatt tgagagctaa 
gatggcaagt ccaaatgcga 
ctgatgtgcc aacctattct 
actgaagttt ccgttaagat 
gttcctatgg aaaaacttaa 
gtagctttag atggtgtcct 
accgatgttg acacaaagga 
gaagtgacag gtgacagttg 
acgcccagag atcttggcgc 
gcaaaaagtc acaatgtttc 
cagctgcgta aacaaattcg 
tgtgctacaa ctagacaggt 
aagattgtta gtacttgttt 
gcattggttt gttatatcgt 
aatgaaatca ttggttacaa 
gatgattgtt ttgcaaataa 
tcatacaaaa atgacaaaag 
ttcatagtgc ctggcttacc 
tttctacctc gtgtttttag 
gagtatagtg attttgctac 
gatgctatgg gcaaacctgt 
tcttatagtg agcttcgtcc 
tttcctaaca cttacctgga 
tgtagacatg gtacatgcga 
tgggttctta ataatgagca 
atgaatctca tagctaacat 
tctgcttcag tagtggctgg 
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ctactacata tggaagagct 
gatgtgctat aagcgcaatc 
gaagagatct ttctatgtct 
gaattgtctc aattgtgaca 
tcgtgatttg tcactccagt 
tgttgatagt gttgctgtga 
aaagacctat gagagacatc 
caacactaaa ggttcactgc 
cgagtctgct tctaagtctg 
gttgcttgac caagctcttg 
gtttgatgct tatgtcgaca 
ggcacttgtt gctacagctc 
ttctacattc gtgtcagctg 
tgttattgaa tgtctcaaac 
taacaatttc atgctcacct 
atgtattgac tgtaatgcaa 
actcatctgg aatgtaaaag 
tagtgctgcc aagaagaaca 
tgtcaatgtc ataactacta 
taaacttatg cttaaggcca 
tatgccagta catacattgt 
agccattcag gatggtgtca 
acatgctggt tttgacgcat 
ctgccctgta gtagctgcta 
gggtactgtg ctgagagcaa 
tgctgttggc aacatttgct 
ctctgcttgc gttcttgctg 
gccatattgt tatgacacta 
agacactcgt tatgtgctta 
gggttctgtt agagtagtaa 
aaggtcagaa gtaggtattt 
ttacagagct ctatcaggag 
ctttactcct cttgtgcaac 
tggtattatt gccatattgg 


atgttcatat catggatggt 
gtgccacacg cgttgagtgt 
atgcaaatgg aggccgtggc 
cattttgcac tggtagtaca 
ttaaaagacc aatcaaccct 
aaaatggcgc gcttcacctc 
cgctctccca ttttgtcaat 
ctattaatgt catagttttt 
cttctgtgta ctacagtcag 
tatcagacgt tggagatagt 
ccttttcagc aacttttagt 
acagcgagtt agcaaagggt 
cccgacaagg tgttgttgat 
tttcacatca ctctgactta 
ataataaggt tgaaaacatg 
ggcatatcaa tgcccaagta 
actacatgtc tttatctgaa 
acataccttt tagactaact 
aaatctcact caagggtggt 
cattattgtg cgttcttgct 
caatccatga tggttacaca 
ctcgtgacat catttctact 
ggtttagcca gcgtggtggt 
tcattacaag agagattggt 
tcaatggtga cttcttgcat 
acacaccttc caaactcatt 
ctgagtgtac aatttttaag 
atttgctaga gggttctatt 
tggatggttc catcatacag 
caacttttga tgctgagtac 
gcctatctac cagtggtaga 
ttttctgtgg tgttgatgcg 
ctgtgggtgc tttagatgtg 
tgacttgtgc tgcctactac 
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tttatgaaat tcagacgtgt 
ttgtttttga tgtctttcac 
gtctactcag tcttttactt 
gctcaccttc aatggtttgc 
tatgtattct gtatttctct 
agagtcatgt ttaatggagt 
ttgctcaaca aggaaatgta 
tataacaggt atcttgctct 
accagctatc gtgaagcagc 
tcaggtgctg atgttctcta 
agtggtttta ggaaaatggc 
acctgtggaa ctacaactct 
catgtcattt gcacagcaga 
aaatccaacc atagctttct 
tctatgcaaa attgtctgct 
tataaatttg tccgtatcca 
tcaccatctg gtgtttatca 
cttaatggat catgtggtag 
tatatgcatc atatggagct 
ttctatggtc catttgttga 
acattaaatg ttttggcatg 
aatagattca ccactacttt 
cctttgacac aagatcatgt 
gtcttagata tgtgtgctgc 
atccttggta gcactatttt 
tctggtgtta ccttccaagg 
cttttaactt tcttgacatc 
ttctttgttt acgagaatgc 
tgtgctatgc tgcttgttaa 
cttgcaacag ttgcttactt 
atgacatggc ttgaattggc 
atgtatgctt cagctttagt 
gctgctagac gtgtttggac 
ggtaatgctt tagatcaagc 


ttttggtgag tacaaccatg 
tatactctgt ctggtaccag 
gtacttgaca ttctatttca 
catgttttct cctattgtgc 
gaagcactgc cattggttct 
tacatttagt accttcgagg 
cctaaaattg cgtagcgaga 
atataacaag tacaagtatt 
ttgctgccac ttagcaaagg 
ccaaccacca cagacatcaa 
attcccgtca ggcaaagttg 
taatggattg tggttggatg 
agacatgctt aatcctaact 
tgttcaggct ggcaatgttc 
taggcttaaa gttgatactt 
acctggtcaa acattttcag 
gtgtgccatg agacctaatc 
tgttggtttt aacattgatt 
tccaacagga gtacacgctg 
cagacaaact gcacaggctg 
gctgtatgct gctgttatca 
gaatgacttt aaccttgtgg 
tgacatattg ggacctcttt 
tttgaaagag ctgctgcaga 
agaagatgag tttacaccat 
taagttcaag aaaattgtta 
actattgatt cttgttcaaa 
tttcttgcca tttactcttg 
gcataagcac gcattcttgt 
taatatggtc tacatgcctg 
tgacactagc ttgtctggtt 
tttgcttatt ctcatgacag 
actgatgaat gtcattacac 
tatttccatg tgggccttag 


ttgttgctgc taatgcactt 
cttacagctt tctgccggga 
ccaatgatgt ttcattcttg 
ctttttggat aacagcaatc 
ttaacaacta tcttaggaaa 
aggctgcttt gtgtaccttt 
cactgttgcc acttacacag 
tcagtggagc cttagatact 
ctctaaatga ctttagcaac 
tcacttctgc tgttctgcag 
aagggtgcat ggtacaagta 
acacagtata ctgtccaaga 
atgaagatct gctcattcgc 
aacttcgtgt tattggccat 
ctaaccctaa gacacccaag 
ttctagcatg ctacaatggt 
ataccattaa aggttctttc 
atgattgcgt gtctttctgc 
gtactgactt agaaggtaaa 
caggtacaga cacaaccata 
atggtgatag gtggtttctt 
caatgaagta caactatgaa 
ctgctcaaac aggaattgcc 
atggtatgaa tggtcgtact 
ttgatgttgt tagacaatgc 
agggcactca tcattggatg 
gtacacagtg gtcactgttt 
gtattatggc aattgctgca 
gcttgtttct gttaccttct 
ctagctgggt gatgcgtatc 
ataggcttaa ggattgtgtt 
ctcgcactgt ttatgatgat 
ttgtttacaa agtctactat 
ttatttctgt aacctctaac 
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tattctggtg 

tcgttacgac tatcatgttt ttagctagag 

ctatagtgtt 

tgtgtgtgtt 

11220 

gagtattacc 

cattgttatt 

tattactggc 

aacaccttac 

agtgtatcat 

gcttgtttat 

11280 

tgtttcttag 

gctattgttg 

ctgctgctac 

tttggccttt 

tctgtttact 

caaccgttac 

11340 

ttcaggctta 

ctcttggtgt 

ttatgactac ttggtctcta 

cacaagaatt 

taggtatatg 

11400 

aactcccagg 

ggcttttgcc tcctaagagt 

agtattgatg 

ctttcaagct 

taacattaag 

11460 

ttgttgggta 

ttggaggtaa 

accatgtatc 

aaggttgcta 

ctgtacagtc 

taaaatgtct 

11520 

gacgtaaagt 

gcacatctgt 

ggtactgctc 

tcggttcttc 

aacaacttag 

agtagagtca 

11580 

tcttctaaat 

tgtgggcaca 

atgtgtacaa 

ctccacaatg 

atattcttct 

tgcaaaagac 

11640 

acaactgaag 

ctttcgagaa 

gatggtttct 

cttttgtctg 

ttttgctatc 

catgcagggt 

11700 

gctgtagaca 

ttaataggtt 

gtgcgaggaa 

atgctcgata 

accgtgctac 

tcttcaggct 

11760 

attgcttcag 

aatttagttc tttaccatca tatgccgctt 

atgccactgc 

ccaggaggcc 

11820 

tatgagcagg 

ctgtagctaa 

tggtgattct 

gaagtcgttc 

tcaaaaagtt 

aaagaaatct 

11880 

ttgaatgtgg 

ctaaatctga 

gtttgaccgt 

gatgctgcca 

tgcaacgcaa 

gttggaaaag 

11940 

atggcagatc 

aggctatgac 

ccaaatgtac 

aaacaggcaa 

gatctgagga 

caagagggca 

12000 

aaagtaacta 

gtgctatgca 

aacaatgctc 

ttcactatgc 

ttaggaagct 

tgataatgat* 

12060 

gcacttaaca 

acattatcaa 

caatgcgcgt 

gatggttgtg 

ttccactcaa 

catcatacca 

12120 

ttgactacag 

cagccaaact 

catggttgtt 

gtccctgatt 

atggtaccta 

caagaacact 

12180 

tgtgatggta 

acacctttac 

atatgcatct 

gcactctggg 

aaatccagca 

agttgttgat 

12240 

gcggatagca 

agattgttca 

acttagtgaa 

attaacatgg 

acaattcacc 

aaatttggct 

12300 

tggcctctta 

ttgttacagc 

tctaagagcc 

aactcagctg 

ttaaactaca 

gaataatgaa 

12360 

ctgagtccag 

tagcactacg 

acagatgtcc 

tgtgcggctg 

gtaccacaca 

aacagcttgt 

12420 

actgatgaca 

atgcacttgc 

ctactataac 

aattcgaagg 

gaggtaggtt 

tgtgctggca 

12480 

ttactatcag 

accaccaaga 

tctcaaatgg 

gctagattcc 

ctaagagtga 

tggtacaggt 

12540 

acaatttaca 

cagaactgga 

accaccttgt 

aggtttgtta 

cagacacacc 

aaaagggcct 

12600 

aaagtgaaat 

acttgtactt 

catcaaaggc 

ttaaacaacc 

taaatagagg 

tatggtgctg 

12660 

ggcagtttag 

ctgctacagt 

acgtcttcag 

gctggaaatg 

ctacagaagt 

acctgccaat 

12720 

tcaactgtgc 

tttccttctg 

tgcttttgca 

gtagaccctg 

ctaaagcata 

taaggattac 

12780 

ctagcaagtg 

gaggacaacc 

aatcaccaac tgtgtgaaga 

tgttgtgtac 

acacactggt 

12840 

acaggacagg 

caattactgt 

aacaccagaa 

gctaacatgg 

accaagagtc 

ctttggtggt 

12900 

gcttcatgtt 

gtctgtattg 

tagatgccac 

attgaccatc 

caaatcctaa 

aggattctgt 

12960 

gacttgaaag 

gtaagtacgt 

ccaaatacct 

accacttgtg 

ctaatgaccc 

agtgggtttt 

13020 

acacttagaa 

acacagtctg 

taccgtctgc 

ggaatgtgga 

aaggttatgg 

ctgtagttgt 

13080 

gaccaactcc 

gcgaaccctt 

gatgcagtct 

gcggatgcat 

caacgttttt 

aaacgggttt 

13140 

gcggtgtaag 

tgcagcccgt 

cttacaccgt 

gcggcacagg 

cactagtact 

gatgtcgtct 

13200 
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acagggcttt 

attgctgtcg 

ttaagaggca 

attgtccagc 

cacatatatc 

gtcattttga 

gtgatgatga 

tacgcgtata 

tctgcgatgc 

ttaatgggaa 

ctattgtgga 

ctgctgagtc 

aatatgattt 

agacatacca 

actttaatgt 

aaatatttgt 

gagtcgtaca 

tagtgtatgc 

gcactacatg 

ccggtaattt 

gaagttctgt 

attatgacta 

tagttgaagt 

aagtaatcgt 

ctagacttta 

agcgtaatgt 

atagagctcg 

atcagaaatt 

gcaagtttta 

cacaccttat 

taatggcctc 

tctacaggtt 

cactatatgt 

gtgtctttaa 


tgatatttac 

cttccaggag 

tactatgtct 

ggttgctgtc 

acgtcagcgt 

tgagggtaat 

ttatttcaat 

tgctaactta 

tatgcgtgat 

ctggtacgat 

ttcatattac 

ccatatggat 

tacggaagag 

tcccaattgt 

gttattttct 

agatggtgtt 

taatcaggat 

tgctgatcca 

cttttcagta 

taataaagac 

tgaactaaaa 

ttatcgttat 

tgttgataaa 

taacaatctg 

ttatgactca 

catccctact 

caccgtagct 

attgaagtca 

cggtggctgg 

gggttgggat 

tcttgttctt 

agctaacgag 

taaaccaggt 

catttgtcaa 


aacgaaaaag 

aaggatgagg 

aactaccaac 

catgactttt 

ctaactaaat 

tgtgatacat 

aagaaggatt 

ggtgagcgtg 

gcaggcattg 

ttcggtgatt 

tcattgctga 

gctgatctcg 

agactttgtc 

attaactgtt 

actgtgtttc 

ccttttgttg 

gtaaacttac 

gctatgcatg 

gctgcactaa 

ttttatgact 

cacttcttct 

aatctgccaa 

tactttgatt 

gataaatcag 

atgagttatg 

ataactcaaa 

ggtgtctcta 

atagccgcca 

cataatatgt 

tatccaaaat 

gctcgcaaac 

tgtgcgcaag 

ggaacatcat 

gctgttacag 


ttgctggttt 

aaggcaattt 

atgaagagac 

tcaagtttag 

acacaatggc 

taaaagaaat 

ggtatgactt 

tacgccaatc 

taggcgtact 

tcgtacaagt 

tgcccatcct 

caaaaccact 

tcttcgaccg 

tggatgatag 

cacctacaag 

tttcaactgg 

atagctcgcg 

cagcttctgg 

caaacaatgt 

ttgctgtgtc 

ttgctcagga 

caatgtgtga 

gttacgatgg 

ctggtttccc 

aggatcaaga 

tgaatcttaa 

tctgtagtac 

ctagaggagc 

taaaaactgt 

gtgacagagc 

ataacacttg 

tattaagtga 

ccggtgatgc 

ccaatgtaaa 


tgcaaagttc 

attagactct 

tatttataac 

agtagatggt 

tgatttagtc 

actcgtcaca 

cgtagagaat 

attattaaag 

gacattagat 

agcaccaggc 

cactttgact 

tattaagtgg 

ttattttaaa 

gtgtatcctt 

ttttggacca 

ataccatttt 

tctcagtttc 

caatttattg 

tgcttttcaa 

taaaggtttc 

tggcaacgct 

tatcagacaa 

tggctgtatt 

atttaataaa 

tgcacttttc 

gtatgccatt 

tatgacaaat 

tactgtggta 

ttacagtgat 

catgcctaac 

ctgtaactta 

gatggtcatg 

tacaactgct 

tgcacttctt 


ctaaaaacta 

tactttgtag 

ttggttaaag 

gacatggtac 

tatgctctac 

tacaattgct 

cctgacatct 

actgtacaat 

aatcaggatc 

tgcggagttc 

agggcattgg 

gatttgctga 

tattgggacc 

cattgtgcaa 

ctagtaagaa 

cgtgagttag 

aaggaacttt 

ctagataaac 

actgtcaaac 

tttaaggaag 

gctatcagtg 

ctcctattcg 

aatgccaacc 

tggggtaagg 

gcgtatacta 

agtgcaaaga 

agacagtttc 

attggaacaa 

gtagaaactc 

atgcttagga 

tcacaccgtt 

tgtggcggct 

tatgctaata 

tcaactgatg 
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gtaataagat 

agctgacaag 

tatgtccgca 

atctacaaca 

caggctctat 

gagtgtctct 

15300 

atagaaatag 

ggatgttgat 

catgaattcg 

tggatgagtt 

ttacgcttac 

ctgcgtaaac 

15360 

atttctccat 

gatgattctt 

tctgatgatg 

ccgttgtgtg 

ctataacagt 

aactatgcgg 

15420 

ctcaaggttt 

agtagctagc 

attaagaact 

ttaaggcagt 

tctttattat 

caaaataatg 

15480 

tgttcatgtc 

tgaggcaaaa 

tgttggactg 

agactgacct 

tactaaagga 

cctcacgaat 

15540 

tttgctcaca 

gcatacaatg 

ctagttaaac 

aaggagatga 

ttacgtgtac 

ctgccttacc 

15600 

cagatccatc 

aagaatatta 

ggcgcaggct 

gttttgtcga 

tgatattgtc 

aaaacagatg 

15660 

gtacacttat 

gattgaaagg 

ttcgtgtcac 

tggctattga 

tgcttaccca 

cttacaaaac 

15720 

atcctaatca 

ggagtatgct 

gatgtctttc 

acttgtattt 

acaatacatt 

agaaagttac 

15780 

atgatgagct 

tactggccac 

atgttggaca 

tgtattccgt 

aatgctaact 

aatgataaca 

15840 

cctcacggta 

ctgggaacct 

gagttttatg 

aggctatgta 

cacaccacat 

acagtcttgc 

15900 

aggctgtagg 

tgcttgtgta 

ttgtgcaatt 

cacagacttc 

acttcgttgc 

ggtgcctgta 

15960 

ttaggagacc 

attcctatgt 

tgcaagtgct 

gctatgacca 

tgtcatttca 

acatcacaca 

16020 

aattagtgtt 

gtctgttaat 

ccctatgttt 

gcaatgcccc 

aggttgtgat 

gtcactgatg 

16080 

tgacacaact 

gtatctagga 

ggtatgagct 

attattgcaa 

gtcacataag 

cctcccatta 

16140 

gttttccatt 

atgtgctaat 

ggtcaggttt 

ttggtttata 

caaaaacaca 

tgtgtaggca 

16200 

gtgacaatgt 

cactgacttc 

aatgcgatag 

caacatgtga 

ttggactaat 

gctggcgatt 

16260 

acatacttgc 

caacacttgt 

actgagagac 

tcaagctttt 

cgcagcagaa 

acgctcaaag 

16320 

ccactgagga 

aacatttaag 

ctgtcatatg 

gtattgccac 

tgtacgcgaa 

gtactctctg 

16380 

acagagaatt 

gcatctttca 

tgggaggttg 

gaaaacctag 

accaccattg 

aacagaaact 

16440 

atgtctttac 

tggttaccgt 

gtaactaaaa 

atagtaaagt 

acagattgga 

gagtacacct 

16500 

ttgaaaaagg 

tgactatggt 

gatgctgttg 

tgtacagagg 

tactacgaca 

tacaagttga 

16560 

atgttggtga 

ttactttgtg 

ttgacatctc 

acactgtaat 

gccacttagt 

gcacctactc 

16620 

tagtgccaca 

agagcactat 

gtgagaatta 

ctggcttgta 

cccaacactc 

aacatctcag 

16680 

atgagttttc 

tagcaatgtt 

gcaaattatc 

aaaaggtcgg 

catgcaaaag 

tactctacac 

16740 

tccaaggacc 

acctggtact 

ggtaagagtc 

attttgccat 

cggacttgct 

ctctattacc 

16800 

catctgctcg 

catagtgtat 

acggcatgct 

ctcatgcagc 

tgttgatgcc 

ctatgtgaaa 

16860 

aggcattaaa 

atatttgccc 

atagataaat 

gtagtagaat 

catacctgcg 

cgtgcgcgcg 

16920 

tagagtgttt 

tgataaattc 

aaagtgaatt 

caacactaga 

acagtatgtt 

ttctgcactg 

16980 

taaatgcatt 

gccagaaaca 

actgctgaca 

ttgtagtctt 

tgatgaaatc 

tctatggcta 

17040 

ctaattatga 

cttgagtgtt 

gtcaatgcta 

gacttcgtgc 

aaaacactac 

gtctatattg 

17100 

gcgatcctgc 

tcaattacca 

gccccccgca 

cattgctgac 

taaaggcaca 

ctagaaccag 

17160 

aatattttaa 

ttcagtgtgc 

agacttatga 

aaacaatagg 

tccagacatg 

ttccttggaa 

17220 

cttgtcgccg 

ttgtcctgct 

gaaattgttg 

acactgtgag 

tgctttagtt 

tatgacaata 

17280 


125 


5 

10 

15 

20 

25 

30 

35 

40 

45 

50 

55 


17340 

17400 

17460 

17520 

17580 

17640 

17700 

17760 

17820 

17880 

17940 

18000 

18060 

18120 

18180 

18240 

18300 

18360 

18420 

18480 

18540 

18600 

18660 

18720 

18780 

18840 

18900 

18960 

19020 

19080 

19140 

19200 

19260 

19320 
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agctaaaagc acacaaggat aagtcagctc aatgcttcaa aatgttctac aaaggtgtta 
ttacacatga tgtttcatct gcaatcaaca gacctcaaat aggcgttgta agagaatttc 
ttacacgcaa tcctgcttgg agaaaagctg tttttatctc accttataat tcacagaacg 
ctgtagcttc aaaaatctta ggattgccta cgcagactgt tgattcatca cagggttctg 
aatatgacta tgtcatattc acacaaacta ctgaaacagc acactcttgt aatgtcaacc 
gcttcaatgt ggctatcaca agggcaaaaa ttggcatttt gtgcataatg tctgatagag 
atctttatga caaactgcaa tttacaagtc tagaaatacc acgtcgcaat gtggctacat 
tacaagcaga aaatgtaact ggacttttta aggactgtag taagatcatt actggtcttc 
atcctacaca ggcacctaca cacctcagcg ttgatataaa gttcaagact gaaggattat 
gtgttgacat accaggcata ccaaaggaca tgacctaccg tagactcatc tctatgatgg 
gtttcaaaat gaattaccaa gtcaatggtt accctaatat gtttatcacc cgcgaagaag 
ctattcgtca cgttcgtgcg tggattggct ttgatgtaga gggctgtcat gcaactagag 
atgctgtggg tactaaccta cctctccagc taggattttc tacaggtgtt aacttagtag 
ctgtaccgac tggttatgtt gacactgaaa ataacacaga attcaccaga gttaatgcaa 
aacctccacc aggtgaccag tttaaacatc ttataccact catgtataaa ggcttgccct 
ggaatgtagt gcgtattaag atagtacaaa tgctcagtga tacactgaaa ggattgtcag 
acagagtcgt gttcgtcctt tgggcgcatg gctttgagct tacatcaatg aagtactttg 
tcaagattgg acctgaaaga acgtgttgtc tgtgtgacaa acgtgcaact tgcttttcta 
cttcatcaga tacttatgcc tgctggaatc attctgtggg ttttgactat gtctataacc 
catttatgat tgatgttcag cagtggggct ttacgggtaa ccttcagagt aaccatgacc 
aacattgcca ggtacatgga aatgcacatg tggctagttg tgatgctatc atgactagat 
gtttagcagt ccatgagtgc tttgttaagc gcgttgattg gtctgttgaa taccctatta 
taggagatga actgagggtt aattctgctt gcagaaaagt acaacacatg gttgtgaagt 
ctgcattgct tgctgataag tttccagttc ttcatgacat tggaaatcca aaggctatca 
agtgtgtgcc tcaggctgaa gtagaatgga agttctacga tgctcagcca tgtagtgaca 
aagcttacaa aatagaggaa ctcttctatt cttatgctac acatcacgat aaattcactg 
atggtgtttg tttgttttgg aattgtaacg ttgatcgtta cccagccaat gcaattgtgt 
gtaggtttga cacaagagtc ttgtcaaact tgaacttacc aggctgtgat ggtggtagtt 
tgtatgtgaa taagcatgca ttccacactc cagctttcga taaaagtgca tttactaatt 
taaagcaatt gcctttcttt tactattctg atagtccttg tgagtctcat ggcaaacaag 
tagtgtcgga tattgattat gttccactca aatctgctac gtgtattaca cgatgcaatt 
taggtggtgc tgtttgcaga caccatgcaa atgagtaccg acagtacttg gatgcatata 
atatgatgat ttctgctgga tttagcctat ggatttacaa acaatttgat acttataacc 
tgtggaatac atttaccagg ttacagagtt tagaaaatgt ggcttataat gttgttaata 
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19380 

19440 

19500 

19560 

19620 

19680 

19740 

19800 

19860 

19920 

19980 

20040 

20100 

20160 

20220 

20280 

20340 

20400 

20460 

20520 

20580 

20640 

20700 

20760 

20820 

20880 

20940 

21000 

21060 

21120 

21180 

21221 
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aaggacactt tgatggacac 
acacaaaggt agatggtatt 
atgttgcatt tgagctttgg 
tcaataattt gggtgttgat 
ccccagcaca tgtatctaca 
ctgagagtgc ttgttcttca 
acctttttag aaacgcccgt 
caccttcaaa gggaccagca 
taaaaacaca gtttaactac 
cctactttac tcagagcaga 
actttctcga gctcgctatg 
tcgaacacat cgtttatgga 
taggcttagc caagcgctca 
acagcacagt gaaaaattac 
gttctgtgat tgatctttta 
cagtgatttc aaaagtggtc 
ggtgtaagga tggacatgtt 
aaccaggtgt tgcgatgcct 
accttcagaa ttatggtgaa 
agtatactca actgtgtcaa 
gagttattca ctttggtgct 
gacaatggtt gccaactggc 
acgcagattc tactttaatt 
ttattattag cgatatgtat 
aagaagggtt tttcacttat 
ctatagctgt aaagataaca 
atttctcatg gtggacagct 
taattggggc taactatctt 
ctaactacat tttctggagg 
acatgagcaa atttcctctt 
aaatcaatga tatgatttat 
acagagttgt ggtttcaagt 

<210 32 
<211> 297 
<212> DNA 

<213> CORONAVIRUS 


gccggcgaag cacctgtttc 
gatgtggaga tctttgaaaa 
gctaagcgta acattaaacc 
atcgctgcta atactgtaat 
ataggtgtct gcacaatgac 
cttactgtct tgtttgatgg 
aatggtgttt taataacaga 
caagctagcg tcaatggagt 
tttaagaaag tagacggcat 
gacttagagg attttaagcc 
gatgaattca tacagcgata 
gatttcagtc atggacaact 
caagattcac cacttaaatt 
ttcataacag atgcgcaaac 
cttgatgact ttgtcgagat 
aaggttacaa ttgactatgc 
gaaaccttct acccaaaact 
aacttgtaca agatgcaaag 
aatgctgtta taccaaaagg 
tacttaaata cacttacttt 
ggctctgata aaggagttgc 
acactacttg tcgattcaga 
ggagactgtg caacagtaca 
gaccctagga ccaaacatgt 
ctgtgtggat ttataaagca 
gagcattctt ggaatgctga 
tttgttacaa atgtaaatgc 
ggcaagccga aggaacaaat 
aacacaaatc ctatccagtt 
aaattaagag gaactgctgt 
tctcttctgg aaaaaggtag 
gatattcttg ttaacaacta 


catcattaat aatgctgttt 
taagacaaca cttcctgtta 
agtgccagag attaagatac 
ctgggactac aaaagagaag 
tgacattgcc aagaaaccta 
tagagtggaa ggacaggtag 
aggttcagtc aaaggtctaa 
cacattaatt ggagaatcag 
tattcaacag ttgcctgaaa 
cagatcacaa atggaaactg 
taagctcgag ggctatgcct 
tggcggtctt catttaatga 
agaggatttt atccctatgg 
aggttcatca aaatgtgtgt 
aataaagtca caagatttgt 
tgaaatttca ttcatgcttt 
acaagcaagt caagcgtggc 
aatgcttctt gaaaagtgtg 
aataatgatg aatgtcgcaa 
agctgtaccc tacaacatga 
accaggtaca gctgtgctca 
tcttaatgac ttcgtctccg 
tacggctaat aaatgggacc 
gacaaaagag aatgactcta 
aaaactagcc ctgggtggtt 
cctttacaag cttatgggcc 
atcatcatcg gaagcatttt 
tgatggctat accatgcatg 
gtcttcctat tcactctttg 
aatgtctctt aaggagaatc 
gcttatcatt agagaaaaca 
a 
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60 

120 

180 

240 

297 

60 

120 

180 

213 
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<400> 32 

atggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga cccacagatt 
caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag cgccgacccc 
aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat ggcaaggagg 
aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc 
aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaatga 


<210> 33 
<211> 98 
<212> PRT 

<213> CORONAVIRUS 
<400> 33 


Met Asp 

Pro 

Asn 

Gin 

Thr 

Asn 

val 

1 



5 




Asp Pro 

Gin 

lie 

Gin 

Leu 

Thr 

lie 



20 





Gin Gly 

Gin 

Asn 

ser 

Ala 

Asp 

Pro 


35 





40 

Leu Gly 

Ser 

Gin 

Leu 

Ser 

Leu 

Ser 

50 





55 


Leu Glu 

Ala 

Arg 

Ala 

Phe 

Gin 

Ser 

65 




70 



Lys Leu 

Ala 

Thr 

Thr 

Glu 

Glu 

Leu 


85 


val 

Pro 

Pro 

Ala 

Leu 

His 

Leu 

Val 


10 





15 


Thr 

Arg 

Met 

Glu 

Asp 

Ala 

Met 

Gly 

25 




30 



Lys 

val 

Tyr 

Pro 

lie 

45 

lie 

Leu 

Arg 

Met 

Ala 

Arg 

Arg 

60 

Asn 

Leu 

Asp 

Ser 

Thr 

Pro 

lie 

Val 

Val 

Gin 

Met 

Thr 



75 





80 

Pro 

Asp 

Glu 

Phe 

Val 

val 

val 

Thr 


90 





95 



Ala Lys 

<210> 34 
<211> 213 
<212> DNA 

<213> CORONAVIRUS 
<400> 34 

atgctgccac cgtgctacaa cttcctcaag gaacaacatt gccaaaaggc ttctacgcag 

agggaagcag aggcggcagt caagcctctt ctcgctcctc atcacgtagt cgcggtaatt 

caagaaattc aactcctggc agcagtaggg gaaattctcc tgctcgaatg gctagcggag 

gtggtgaaac tgccctcgcg ctattgctgc tag 
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<210> 35 
<211> 70 
<212> PRT 

<213> CORONAVIRUS 
<400> 35 


Met 

Leu 

Pro 

Pro 

Cys 

Tyr 

Asn 

Phe 

Leu 

Lys 

Glu 

Gin 

His 

cys 

Gin 

Lys 

1 




5 




10 




15 

Ala 

Ser 

Thr 

Gin 

Arg 

Glu 

Ala 

Glu 

Ala 

Ala 

Val 

Lys 

Pro 

Leu 

Leu 

Ala 




20 




25 




30 



Pro 

His 

His 

Val 

Val 

Ala 

val 

lie 

Gin 

Glu 

lie 

Gin 

Leu 

Leu 

Ala 

Ala 



35 





40 





45 




val 

Gly 

Glu 

lie 

Leu 

Leu 

Leu 

Glu 

Trp 

Leu 

Ala 

Glu 

Val 

Val 

Lys 

Leu 


50 





55 




60 




Pro 

ser 

Arg 

Tyr 

cys 

Cys 











65 




70 












<210> 36 
<211> 1377 
<212> DNA 

<213> CORONAVIRUS 

< 220 > 

<221> CDS 
<222> (67)..(1335) 
<223> 

<400> 36 


atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60 
attaaa atg tct gat aat gga ccc caa tea aac caa cgt agt gee ccc 108 
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156 

204 

252 

300 

348 

396 

444 

492 

540 

588 

636 

684 

732 

780 

828 

876 

924 
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Met ser Asp Asn Gly Pro Gin Ser Asn Gin Arg ser Ala Pro 
1 5 10 


cgc 

Arg 

15 

att 

lie 

aca 

Thr 

ttt 

Phe 

ggt 

Gly 

gga 

Gly 

20 

ccc 

Pro 

aca 

Thr 

gat 

Asp 

tea 

Ser 

act 

Thr 

25 

gac 

Asp 

aat 

Asn 

aac 

Asn 

cag 

Gin 

aat 

Asn 

30 

gga 

Gly 

gga 

Gly 

cgc 

Arg 

aat 

Asn 

ggg 

Gly 

35 

gca agg 
Ala Arg 

cca 

Pro 

aaa 

Lys 

cag 

Gin 

40 

cgc 

Arg 

ega 

Arg 

ccc 

Pro 

caa 

Gin 

ggt 

Gly 

45 

tta 

Leu 

ccc 

Pro 

aat 

Asn 

aat 

Asn 

act 

Thr 

50 

geg 

Ala 

tct tgg 
Ser Trp 

ttc 

Phe 

aca 

Thr 

55 

get 

Ala 

etc 

Leu 

act 

Thr 

cag 

Gin 

cat 

His 

60 

ggc 

Gly 

aag 

Lys 

gag 

Gill 

gaa 

Glu 

ett 

Leu 

65 

aga 

Arg 

ttc 

Phe 

cct ega 
Pro Arg 

ggc 

Gly 

70 

cag 

Gin 

ggc 

Gly 

gtt 

Val 

cca 

Pro 

ate 

lie 

75 

aac 

Asn 

acc 

Thr 

aat 

Asn 

agt 

Ser 

gat 

Gly 

80 

cca 

Pro 

gat 

Asp 

gac 

Asp 

caa 

Gin 

att 

He 

85 

ggc 

Gly 

tac 

Tyr 

tac 

Tyr 

ega 

Arg 

aga 

Arg 

90 

get 

Ala 

acc 

Thr 

ega 

Arg 

ega 

Arg 

gtt 

Val 

95 

cgt 

Arg 

ggt 

Gly 

ggt 

Gly 

gac 

Asp 

ggc 

Gly 

100 

aaa 

Lys 

atg 

Met 

aaa 

Lys 

gag 

Glu 

etc 

Leu 

105 

age 

Ser 

ccc 

Pro 

aga 

Arg 

tgg 

Trp 

tac 

Tyr 

110 

ttc 

Phe 

tat 

Tyr 

tac 

Tyr 

eta 

Leu 

gga 

Gly 

115 

act 

Thr 

ggc 

Gly 

cca 

Pro 

gaa 

Glu 

get 

Ala 

120 

tea 

Ser 

ett 

Leu 

ccc 

Pro 

tac 

Tyr 

ggc 

Gly 

125 

get 

Ala 

aac 

Asn 

aaa 

Lys 

gaa 

Glu 

ggc 

Gly 

130 

ate 

lie 

gta tgg 
Val Trp 

gtt 

Val 

gca 

Ala 

135 

act 

Thr 

gag 

Glu 

gga 

Gly 

gcc 

Ala 

ttg 

Leu 

140 

aat 

Asn 

aca 

Thr 

ccc 

Pro 

aaa 

Lys 

gac 

ASp 

145 

cac 
Hi s 

att 

lie 

ggc 

Gly 

acc 

Thr 

cgc 

Arg 

150 

aat 

Asn 

cct 

Pro 

aat 

Asn 

aac 

Asn 

aat 

Asn 

155 

get 

Ala 

gcc 

Ala 

acc 

Thr 

gtg 

val 

eta 

Leu 

160 

caa 

Gin 

ett 

Leu 

cct 

Pro 

caa 

Gin 

gga 

Gly 

165 

aca 

Thr 

aca 

Thr 

ttg 

Leu 

cca 

Pro 

aaa 

Lys 

170 

ggc 

Gly 

ttc 

Phe 

tac 

Tyr 

gca 

Ala 

gag 

Glu 

175 

gga 

Gly 

age 

ser 

aga 

Arg 

ggc 

Gly 

ggc 

Gly 

180 

agt 

Ser 

caa 

Gin 

gcc 

Ala 

tct 

Ser 

tct 

Ser 

185 

cgc 

Arg 

tee 

Ser 

tea 

Ser 

tea 

Ser 

cgt 

Arg 

190 

agt 

Ser 

cgc 

Arg 

ggt 

Gly 

aat 

Asn 

tea 

Ser 

195 

aga 

Arg 

aat 

Asn 

tea 

Ser 

act 

Thr 

cct 

Pro 

200 

ggc 

Gly 

age 

Ser 

agt 

Ser 

agg 

Arg 

gga 

Gly 

205 

aat 

Asn 

tct 

ser 

cct 

Pro 

get 

Ala 

ega 

Arg 

210 

atg 

Met 

get 

Ala 

age 

ser 

gga 

Gly 

ggt 

Gly 

215 

ggt 

Gly 

gaa 

Glu 

act 

Thr 

gee 

Ala 

etc 

Leu 

220 

geg 
a! a 

eta 

Leu 

ttg 

Leu 

ctg 

Leu 

eta 

Leu 

225 

gac 

Asp 

aga 

Arg 

ttg 

Leu 

aac 

Asn 

cag 

Gin 

230 

ett 

Leu 

gag 

Glu 

age 

ser 

aaa 

Lys 

gtt 

val 

235 

tct 

Ser 

ggt 

Gly 

aaa 

Lys 

ggc 

Gly 

caa 

Gin 

240 

caa 

Gin 

caa 

Gin 

caa 

Gin 

ggc 

Gly 

caa 

Gin 

245 

act 

Thr 

gtc 

val 

act 

Thr 

aag 

Lys 

aaa 

Lys 

250 

tct 

Ser 

get 

Ala 

get 

Ala 

gag 

Glu 

gca 

Ala 

255 

tct 

ser 

aaa 

Lys 

aag 

Lys 

cct 

Pro 

cgc 

Arg 

260 

caa 

Gin 

aaa 

Lys 

cgt 

Arg 

act 

Thr 

gee 

Ala 

265 

aca 

Thr 

aaa 

Lys 

cag 

Gin 

tac 

Tyr 

aac 

Asn 

270 

gtc 

act 

caa 

gca 

ttt 

ggg 

aga 

cgt 

ggt 

cca 

gaa 

caa 

acc 

caa 

gga 

aat 
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Val 

Thr 

Gl n 

Ala 

Phe 

Gly 

Arg 

Arg 

Gly 

Pro 

Glu 

Gin 

Thr 

Gin 

Gly 

Asn 





275 


280 





285 


ttc 

ggg 

gac 

caa 

gac 

eta 

ate 

aga 

caa 

gga 

act 

gat 

tac 

aaa 

cat 

tgg 

Phe 

Gly 

Asp 

Gin 

Asp 

Leu 

lie 

Arg 

Gin 

Gly 

Thr 

Asp 

Tyr 

Lys 

His 

Trp 




290 





295 



300 



ccg 

caa 

att 

gca 

caa 

ttt 

get 

cca 

agt 

gee 

tet 

gca 

ttc 

ttt 

gga 

atg 

Pro 

Gin 

lie 

Ala 

Gin 

Phe 

Ala 

Pro 

Ser 

Ala 

Ser 

Ala 

Phe 

Phe 

Gly 

Met 



305 





310 





315 




tea 

ege 

att 

ggc 

atg 

gaa 

gtc 

aca 

cct 

teg 

gga 

aca 

tgg 

ctg 

act 

tat 

Ser 

Arg 

lie 

Gly 

Met 

Glu 

val 

Thr 

Pro 

Ser 

Gly 

Thr 

Trp 

Leu 

Thr 

Tyr 


320 




325 





330 



cat 

gga 

gee 

att 

aaa 

ttg 

gat 

gac 

aaa 

gat 

cca 

caa 

ttc 

aaa 

gac 

aac 

His 

Gly 

Ala 

lie 

Lys 

Leu 

Asp 

ASP 

Lys 

Asp 

Pro 

Gin 

Phe 

Lys 

Asp 

Asn 

335 




340 




345 




350 

gtc 

ata 

ctg 

ctg 

aac 

aag 

cac 

att 

gac 

gca 

tac 

aaa 

aca 

ttc 

cca 

cca 

val 

lie 

Leu 

Leu 

Asn 

Lys 

Hi s 

lie 

Asp 

Ala 

Tyr 

Lys 

Thr 

Phe 

Pro 

Pro 





355 



360 



365 


aca 

gag 

cct 

aaa 

aag 

gac 

aaa 

aag 

aaa 

aag 

act 

gat 

gaa 

get 

cag 

cct 

Thr 

Glu 

Pro 

Lys 

Lys 

Asp 

Lys 

Lys 

Lys 

Lys 

Thr 

Asp 

Glu 

Ala 

Gin 

Pro 




370 





375 





380 



ttg 

ccg 

cag 

aga 

caa 

aag 

aag 

cag 

ccc 

act 

gtg 

act 

ett 

ett 

cct 

geg 

Leu 

Pro 

Gin 

Arg 

Gin 

Lys 

Lys 

Gin 

Pro 

Thr 

val 

Thr 

Leu 

Leu 

Pro 

Ala 



385 


390 





395 




get 

gac 

atg 

gat 

gat 

ttc 

tee 

aga 

caa 

ett 

caa 

aat 

tee 

atg 

agt 

gga 

Ala 

Asp 

Met 

Asp 

Asp 

Phe 

ser 

Arg 

Gin 

Leu 

Gin 

Asn 

Ser 

Met 

Ser 

Gly 


400 



405 




410 






get tet get gat tea act cag gca taa acactcatga tgaccacaca 
Ala Ser Ala Asp Ser Thr Gin Ala 
415 420 

aggeagatgg gctatgtaaa eg 


<210> 37 
<211 >422 
<212> PRT 

<213> CORONAVIRUS 


<400> 37 















Met 

Ser 

Asp 

Asn 

Gly 

Pro 

Gin 

Ser 

Asn 

Gin 

Arg 

Ser 

Ala 

pro 

Arg 

lie 

1 




5 





10 




15 


Thr 

Phe 

Gly 

Gly 

Pro 

Thr 

Asp 

ser 

Thr 

Asp 

Asn 

Asn 

Gin 

Asn 

Gly 

Gly 




20 





25 




30 

Arg 

Asn 

Gly 

Ala 

Arg 

Pro 

Lys 

Gin 

Arg 

Arg 

Pro 

Gin 

Gly 

Leu 

Pro 

Asn 



35 




40 



45 




Asn 

Thr 

Ala 

ser 

Trp 

Phe 

Thr 

Ala 

Leu 

Thr 

Gin 

His 

Gly 

Lys 

Glu 

Glu 


50 




55 





60 
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Leu Arg Phe Pro Arg Gly Gin Gly Val Pro lie Asn Thr Asn ser Gly 
65 70 75 80 


Pro Asp Asp Gin lie Gly Tyr Tyr Arg Arg Ala Thr Arg Arg val Arg 
85 90 95 


Gly Gly Asp Gly Lys Met Lys Glu Leu ser Pro Arg Trp Tyr Phe Tyr 
100 105 110 


Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys 
115 120 125 


Glu Gly He Val Trp val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 
130 135 140 


Asp His lie Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr val Leu 
145 150 155 160 


Gin Leu Pro Gin Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 
165 170 175 


Ser Arg Gly Gly ser Gin Ala Ser ser Arg Ser Ser ser Arg Ser Arg 
180 185 190 


Gly Asn ser Arg Asn ser Thr Pro Gly ser Ser Arg Gly Asn Ser Pro 
195 200 205 


Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu 
210 215 220 


Leu Asp Arg Leu Asn Gin Leu Glu Ser Lys val Ser Gly Lys Gly Gin 
225 230 235 240 


Gin Gin Gin Gly Gin Thr Val Thr Lys Lys ser Ala Ala Glu Ala ser 
245 250 255 


Lys Lys Pro Arg Gin Lys Arg Thr Ala Thr Lys Gin Tyr Asn val Thr 
260 265 270 


Gin Ala phe Gly Arg Arg Gly Pro Glu Gin Thr Gin Gly Asn Phe Gly 
275 280 285 


Asp Gin Asp Leu lie Arg Gin Gly Thr Asp Tyr Lys His Trp Pro Gin 
290 295 300 


lie Ala Gin Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 
305 310 315 320 


lie Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly 
325 330 335 
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Ala 

lie 

Lys 

Leu 

Asp 

Asp 

Lys 

Asp 

Pro 

Gin 

Phe 

Lys 

Asp 

Asn 

val 

lie 




340 


345 



350 



Leu 

Leu 

Asn 

Lys 

Hi s 

lie 

Asp 

Ala 

Tyr 

Lys 

Thr 

Phe 

Pro 

Pro 

Thr 

Glu 



355 




360 



365 




Pro 

Lys 

Lys 

Asp 

Lys 

Lys 

Lys 

Lys 

Thr 

Asp 

Glu 

Ala 

Gin 

Pro 

Leu 

Pro 


370 





375 




380 





Gin 

Arg 

Gin 

Lys 

Lys 

Gin 

Pro 

Thr 

val 

Thr 

Leu 

Leu 

Pro 

Ala 

Ala 

Asp 

385 





390 





395 





400 

Met 

Asp 

Asp 

Phe 

Ser 

Arg 

Gin 

Leu 

Gin 

Asn 

Ser 

Met 

Ser 

Gly 

Ala 

Ser 




405 




410 




415 


Ala 

Asp 

Ser 

Thr 

Gin 

Ala 













420 














<210> 38 
<211> 1377 
<212> DNA 

<213> CORONAVIRUS 
<400> 38 

atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 
attaaaatgt ctgataatgg accccaatca aaccaacgta gtgccccccg cattacattt 
ggtggaccca cagattcaac tgacaataac cagaatggag gacgcaatgg ggcaaggcca 
aaacagcgcc gaccccaagg tttacccaat aatactgcgt cttggttcac agctctcact 
cagcatggca aggaggaact tagattccct cgaggccagg gcgttccaat caacaccaat 
agtggtccag atgaccaaat tggctactac cgaagagcta cccgacgagt tcgtggtggt 
gacggcaaaa tgaaagagct cagccccaga tggtacttct attacctagg aactggccca 
gaagcttcac ttccctacgg cgctaacaaa gaaggcatcg tatgggttgc aactgaggga 
gccttgaata cacccaaaga ccacattggc acccgcaatc ctaataacaa tgctgccacc 
gtgctacaac ttcctcaagg aacaacattg ccaaaaggct tctacgcaga gggaagcaga 
ggcggcagtc aagcctcttc tcgctcctca tcacgtagtc gcggtaattc aagaaattca 
actcctggca gcagtagggg aaattctcct gctcgaatgg ctagcggagg tggtgaaact 
gccctcgcgc tattgctgct agacagattg aaccagcttg agagcaaagt ttctggtaaa 
ggccaacaac aacaaggcca aactgtcact aagaaatctg ctgctgaggc atctaaaaag 
cctcgccaaa aacgtactgc cacaaaacag tacaacgtca ctcaagcatt tgggagacgt 
ggtccagaac aaacccaagg aaatttcggg gaccaagacc taatcagaca aggaactgat 
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tacaaacatt ggccgcaaat tgcacaattt gctccaagtg cctctgcatt 

tcacgcattg gcatggaagt cacaccttcg ggaacatggc tgacttatca 

aaattggatg acaaagatcc acaattcaaa gacaacgtca tactgctgaa 

gacgcataca aaacattccc accaacagag cctaaaaagg acaaaaagaa 

gaagctcagc ctttgccgca gagacaaaag aagcagccca ctgtgactct 

gctgacatgg atgatttctc cagacaactt caaaattcca tgagtggagc 

tcaactcagg cataaacact catgatgacc acacaaggca gatgggctat 

<210> 39 
<211> 204 
<212> DNA 

<213> CORONAVIRUS 
<400> 39 

atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg 

ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta 

gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac 

tctgcagact gcttacggtt tcgt 


<210> 40 
<211> 809 
<212> DNA 

<213> CORONAVIRUS 
<400> 40 


actcaagcat 

ctaatcagac 

gcctctgcat 

ctgacttatc 

atactgctga 

gacaaaaaga 

actgtgactc 

atgagtggag 

agatgggcta 

gaatgaattc 

aatctttaat 


ttgggagacg 

aaggaactga 

tctttggaat 

atggagccat 

acaagcacat 

aaaagactga 

ttcttcctgc 

cttctgctga 

tgtaaacgtt 

tcgtaactaa 

caatgtgtaa 


tggtccagaa 

ttacaaacat 

gtcacgcatt 

taaattggat 

tgacgcatac 

tgaagctcag 

ggctgacatg 

ttcaactcag 

ttcgcaattc 

acagcacaag 

cattagggag 


caaacccaag 

tggccgcaaa 

ggcatggaag 

gacaaagatc 

aaaacattcc 

cctttgccgc 

gatgatttct 

gcataaacac 

cgtttacgat 

taggtttagt 

gacttgaaag 


gaaatttcgg 

ttgcacaatt 

tcacaccttc 

cacaattcaa 

caccaacaga 

agagacaaaa 

ccagacaact 

tcatgatgac 

acatagtcta 

taactttaat 

agccaccaca 


ctttggaatg 

tggagccatt 

caagcacatt 

aaagactgat 

tcttcctgcg 

ttctgctgat 

gtaaacg 


tagatctgtt 

gtgcacctac 

tcgtccctct 


ggaccaagac 

tgctccaagt 

gggaacatgg 

agacaacgtc 

gcctaaaaag 

gaagcagccc 

tcaaaattcc 

cacacaaggc 

ctcttgtgca 

ctcacatagc 

ttttcatcga 
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ggccacgcgg agtacgatcg agggtacagt gaataatgct agggagagct gcctatatgg 
aagagcccta atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct 
tcttaggaga atgacaaaaa aaaaaaaaa 


<21o> 41 
<211 >448 
<212> DNA 

<213> CORONAVIRUS 
<400>41 

aatgaacaca tagggctgtt 
acaagtgcca tttttgaggt 
gaagccacgc actagcacgt 
tttctcgttg acaccaagaa 
acctaggtat gctgatgatc 
gggacgagtt actcgtttct 
ggtgcactag gcatgcagcc 
agatctacaa gagatcgagg 

<210> 42 
<211> 2033 
<212> DNA 

<213> CORONAVIRUS 
<400> 42 

atacctaggt ttcgtccggg 
caacgagaaa acacacgtcc 
gcgtggcttc ggggactctg 
tggcacttgt ggtctagtag 
tgtgttcatt aaacgttctg 
ggttgcagaa atggacggca 
gccacatgtg ggcgaaaccc 
taagggagcc ggtggtcata 
gcttggcact gatcccattg 
tgcactccgt gaactcactc 
caatttctgt ggcccagatg 


caagctgggg cagtacgcct 
gttcacgtgc ctccgatagg 
ctctaacctg aaggacaggc 
caaggctctc catcttacct 
gactgcaaca cggacgaaac 
tgtcaacgac agtaaaattt 
gagcgacagc tacacagatt 
ttggttgg 


tgtgaccgaa aggtaagatg 
aactcagttt gcctgtcctt 
tggaagaggc cctatcggag 
agctggaaaa aggcgtactg 
atgccttaag caccaatcac 
ttcagtacgg tcgtagcggt 
caattgcata ccgcaatgtt 
gctatggcat cgatctaaag 
aagattatga acaaaactgg 
gtgagctcaa tggaggtgca 
ggtaccctct tgattgcatc 


ttttccagct ctactagacc 
gcctcttcca cagagtcccc 
aaactgagtt ggacgtgtgt 
ttcggtcaca cccggacgaa 
cgtaagcagt ctgcagaaga 
attattgttt atactgcgta 
ttaaagttcg tttagagaac 


gagagccttg ttcttggtgt 
caggttagag acgtgctagt 
gcacgtgaac acctcaaaaa 
ccccagcttg aacagcccta 
ggccacaagg tcgttgagct 
ataacactgg gagtactcgt 
cttcttcgta agaacggtaa 
tcttatgact taggtgacga 
aacactaagc atggcagtgg 
gtcactcgct atgtcgacaa 
aaagattttc tcgcacgcgc 
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gggcaagtca atgtgcactc 
ctactgctgc cgtgaccatg 
ctacgagcac cagacaccct 
ggaatgccca aagtttgtgt 
tgaaaagaaa aagactgagg 
tccacaggag tgtaacaata 
agtttcatgg cagacgtgcg 
tttagttatt gaaggaccta 
gccatgtcct gcctgtcaag 
caaccactca aacattgaaa 
ctgtgtgttt gcctatgttg 
tgctgatatt ggctcaggcc 
ggatctcctt gagatactga 
tttgaatgaa gaggttgcca 
tgacactata aagagtcttg 
ctataaagtt accaagggaa 
agttttaaca ccactgtgtg 
tgcgcgcaca cttgatgcag 
catacttgat ggtatttctg 
agacctgctc accaacagtg 
gacttctcag tggttgtcta 
tgaatggatt gaggcgaaac 
tctcaaattt ctcattacag 

<210> 43 
<211> 2018 
<212> DNA 

<213> CORONAVIRUS 
<400> 

ggattgaggc gaaacttagt 
aatttctcat tacaggtgtt 
acatcaagga ttgtgtaaaa 
ttgatcaagt cactatcgct 
tcgctcaaag caagggactt 


EP 1 694 829 B1 

tttccgaaca acttgattac 
agcatgaaat tgcctggttc 
tcgaaattaa gagtgccaag 
ttcctcttaa ctcaaaagtc 
gtttcatggg gcgtatacgc 
tgcacttgtc taccttgatg 
actttctgaa agccacttgt 
ctacatgtgg gtacctacct 
acccagagat tggacctgag 
ctcgactccg caagggaggt 
gctgctataa taagcgtgcc 
atactggcat tactggtgac 
gtcgtgaacg tgttaacatt 
tcattttggc atctttctct 
attacaagtc tttcaaaacc 
agcccgtaaa aggtgcttgg 
gttttccctc acaggctgct 
caaaccactc aattcctgat 
aacagtcatt acgtcttgtc 
tcattattat ggcatatgta 
atcttttggg cactactgtt 
ttagtgcagg agttgaattt 
gtgtttttga catcgtcaag 


gcaggagttg aatttctcaa 
tttgacatcg tcaagggtca 
tgcttcattg atgttgttaa 
ggcgcaaagt tgcgatcact 
taccgtcagt gtatacgtgg 


atcgagtcga agagaggtgt 
actgagcgct ctgataagag 
aaatttgaca ctttcaaagg 
aaagtcattc aaccacgtgt 
tctgtgtacc ctgttgcatc 
aaatgtaatc attgcgatga 
gaacattgtg gcactgaaaa 
actaatgctg tagtgaaaat 
catagtgttg cagattatca 
aggactagat gttttggagg 
tactgggttc ctcgtgctag 
aatgtggaga ccttgaatga 
aacattgttg gcgattttca 
gcttctacaa gtgcctttat 
attgttgagt cctgcggtaa 
aacattggac aacagagatc 
ggtgttatca gatcaatttt 
ttgcaaagag cagctgtcac 
gacgccatgg tttatacttc 
actggtggtc ttgtacaaca 
gaaaaactca ggcctatctt 
ctcaaggatg cttgggagat 
ggtcaaatac agg 


ggatgcttgg gagattctca 
aatacaggtt gcttcagata 
caaggcactc gaaatgtgca 
caacttaggt gaagtcttca 
caaggagcag ctgcaactac 
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tcatgcctct taaggcacca aaagaagtaa 
tacttacctc tgaggaggtt gttctcaaga 
ttgatagctt cacaaatgga gctatcgttg 
tcttagagat taaggacaaa gaacaatact 
acaatgtctt tcgcttaaaa gggggtgcac 
ctgtttggga agttcaaggt tacaagaatg 
ttgacaaagt gcttaatgaa aagtgctctg 
ctgagtttgc atgtgttgta gcagaggctg 
tccttaccaa catgggtatt gatcttgatg 
atgatgctgg tgaagaaaac ttttcatcac 
aggaagaaga ggacgatgca gagtgtgagg 
agtacggtac agaggatgat tatcaaggtc 
cagttcgagt tgaggaagaa gaagaggaag 
agattgagcc agaaccagaa cctacacctg 
taaaacttac tgacaatgtt gccattaaat 
ctaatcctat ggtgattgta aatgctgcta 
caggtgcact caacaaggca accaatggtg 
agctaaatgg ccctcttaca gtaggagggt 
agaagtgtct gcatgttgtt ggacctaacc 
aggcagcata tgaaaatttc aattcacagg 
gcatatttgg tgctaaacca cttcagtctt 
aggtttatat tgcagtcaat gacaaagctc 
ataacctgaa gcctagagtg gaagcaccta 
ccaaaactga ggagaaatct gtcgtacaga 
cctgcattga tgaggttacc acaacactgg 
tcttgtttgc tgatatcaat ggtaagcttt 
aagatatgtc tttccttgag aaggatgcac 
gtgatatcac ttgtgttgta ataccctcca 
caagagcttt gaagaaagtg ccagttgatg 

<210> 44 
<211> 1442 
<212> DNA 

<213> CORONAVIRUS 
<400> 44 


cctttcttga aggtgattca catgacacag 
acggtgaact cgaagcactc gagacgcccg 
gcacaccagt ctgtgtaaat ggcctcatgc 
gcgcattgtc tcctggttta ctggctacaa 
caattaaagg tgtaaccttt ggagaagata 
tgagaatcac atttgagctt gatgaacgtg 
tctacactgt tgaatccggt accgaagtta 
ttgtgaagac tttacaacca gtttctgatc 
agtggagtgt agctacattc tacttatttg 
gtatgtattg ttccttttac cctccagatg 
aagaagaaat tgatgaaacc tgtgaacatg 
tccctctgga atttggtgcc tcagctgaaa 
actggctgga tgatactact gagcaatcag 
aagaaccagt taatcagttt actggttatt 
gtgttgacat cgttaaggag gcacaaagtg 
acatacacct gaaacatggt ggtggtgtag 
ccatgcaaaa ggagagtgat gattacatta 
cttgtttgct ttctggacat aatcttgcta 
taaatgcagg tgaggacatc cagcttctta 
acatcttact tgcaccattg ttgtcagcag 
tacaagtgtg cgtgcagacg gttcgtacac 
tttatgagca ggttgtcatg gattatcttg 
aacaagagga gccaccaaac acagaagatt 
agcctgtcga tgtgaagcca aaaattaagg 
aagaaactaa gtttcttacc aataagttac 
accatgattc tcagaacatg cttagaggtg 
cttacatggt aggtgatgtt atcactagtg 
aaaaggctgg tggcactact gagatgctct 
agtatata 
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ttgatgaggt taccacaaca 
ttgctgatat caatggtaag 
tgtctttcct tgagaaggat 
tcacttgtgt tgtaataccc 
ctttgaagaa agtgccagtt 
gttatacact tgaggaagct 
taccttcaga agcacctaat 
gagaaatgct tgctcatgct 
gagccataat ggcaaccatc 
ttgactatgg tgtccgattc 
cgaagctgaa ctctctaaat 
gttttaatct tgaagaggct 
cagtatcatc accagatgct 
catctgagga gcactttgta 
attcaggaca gcgtacagag 
accacactct ggagagcccc 
aactaaagag tctcttatcc 
acaacactaa tctccacaca 
gtccaacata cttggatggt 
gtaagacttt ctttgtacta 
accatactct tgatgagagt 
aatggaaatt tcctcaagtt 
atttgtctag tgttttatta 
ttcaagaggc ttattataga 
tc 


ctggaagaaa ctaagtttct 
ctttaccatg attctcagaa 
gcaccttaca tggtaggtga 
tccaaaaagg ctggtggcac 
gatgagtata taaccacgta 
aagactgctc ttaagaaatg 
gctaaggaag agattctagg 
gaagagacaa gaaaattaat 
caacgtaagt ataaaggaat 
ttcttttata ctagtaaaga 
gagccgcttg tcacaatgcc 
gcgcgctgta tgcgttctct 
gttactacat ataatggata 
gaaacagttt ctttggctgg 
ttaggtgttg aatttcttaa 
gtcgagtttc atcttgacgg 
ctgcgggagg ttaagactat 
cagcttgtgg atatgtctat 
gctgatgtta caaaaattaa 
cctagtgatg acacactacg 
tttcttggta ggtacatgtc 
ggtggtttaa cttcaattaa 
gcacttcaac agcttgaagt 
gcccgtgctg gtgatgctgc 


taccaataag ttactcttgt 
catgcttaga ggtgaagata 
tgttatcact agtggtgata 
tactgagatg ctctcaagag 
ccctggacaa ggatgtgctg 
caaatctgca ttttatgtac 
aactgtatcc tggaatttga 
gcctatatgc atggatgtta 
taaaattcaa gagggcatcg 
gcctgtagct tctattatta 
aattggttat gtgacacatg 
taaagctcct gccgtagtgt 
cctcacttcg tcatcaaaga 
ctcttacaga gattggtcct 
gcgtggtgac aaaattgtgt 
tgaggttctt tcacttgaca 
aaaagtgttc acaactgtgg 
gacatatgga cagcagtttg 
acctcatgta aatcatgagg 
tagtgaagct ttcgagtact 
tgctttaaac cacacaaaga 
atgggctgat aacaattgtt 
caaattcaat gcaccagcac 
taacttttgt gcactcatac 


<210> 45 
<211> 1050 
<212> DNA 

<213> CORONAVIRUS 
<400> 45 

atatgtctat gacatatgga cagcagtttg gtccaacata cttggatggt gctgatgtta 
caaaaattaa acctcatgta aatcatgagg gtaagacttt ctttgtacta cctagtgatg 
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acacactacg tagtgaagct ttcgagtact 
ggtacatgtc tgctttaaac cacacaaaga 
cttcaattaa atgggctgat aacaattgtt 
agcttgaagt caaattcaat gcaccagcac 
gtgatgctgc taacttttgt gcactcatac 
ttggtgatgt cagagaaact atgacccatc 
agcgagttct taatgtggtg tgtaaacatt 
tagaagctgt gatgtatatg ggtactctat 
ttccatgtgt gtgtggtcgt gatgctacac 
ttatgatgtc tgcaccacct gctgagtata 
atgagtacac tggtaactat cagtgtggtc 
tctatcgtat tgacggagct caccttacaa 
atgttttcta caaggaaaca tcttacacta 
atggagttac ttacacagag attgaaccaa 
cttactatac agagcagcct atagaccttg 
ttgataattt caaactcaca tgttctaaca 

<210> 46 

<211> 1995 

<212> DNA 

<213> CORONAVIRUS 

<400> 46 

tttgtgcact catactcgct tacagtaata 
aaactatgac ccatcttcta cagcatgcta 
tggtgtgtaa acattgtggt cagaaaacta 
atatgggtac tctatcttat gataatctta 
gtcgtgatgc tacacaatat ctagtacaac 
cacctgctga gtataaatta cagcaaggta 
actatcagtg tggtcattac actcatataa 
gagctcacct tacaaagatg tcagagtaca 
aaacatctta cactacaacc atcaagcctg 
cagagattga accaaaattg gatgggtatt 
agcctataga ccttgtacca actcaaccat 
tcacatgttc taacacaaaa tttgctgatg 


accatactct tgatgagagt tttcttggta 
aatggaaatt tcctcaagtt ggtggtttaa 
atttgtctag tgttttatta gcacttcaac 
ttcaagaggc ttattataga gcccgtgctg 
tcgcttacag taataaaact gttggcgagc 
ttctacagca tgctaatttg gaatctgcaa 
gtggtcagaa aactactacc ttaacgggtg 
cttatgataa tcttaagaca ggtgtttcca 
aatatctagt acaacaagag tcttcttttg 
aattacagca aggtacattc ttatgtgcga 
attacactca tataactgct aaggagaccc 
agatgtcaga gtacaaagga ccagtgactg 
caaccatcaa gcctgtgtcg tataaactcg 
aattggatgg gtattataaa aaggataatg 
taccaactca accattacca aatgcgagtt 


aaactgttgg cgagcttggt gatgtcagag 
atttggaatc tgcaaagcga gttcttaatg 
ctaccttaac gggtgtagaa gctgtgatgt 
agacaggtgt ttccattcca tgtgtgtgtg 
aagagtcttc ttttgttatg atgtctgcac 
cattcttatg tgcgaatgag tacactggta 
ctgctaagga gaccctctat cgtattgacg 
aaggaccagt gactgatgtt ttctacaagg 
tgtcgtataa actcgatgga gttacttaca 
ataaaaagga taatgcttac tatacagagc 
taccaaatgc gagttttgat aatttcaaac 
atttaaatca aatgacaggc ttcacaaagc 
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cagcttcacg 

agagctatct 

gtcacattct 

tcccagactt 

gaatggcgat 

gtagtggcta 

ttgactatag 

acactattca 

gcgagtttca 

agaaaggtgc 

taaattactg 

cataagccaa 

ttgtttggca 

cattaaccag 

gctacaacca 

agacaacgtt 

caaaccaaac 

acttggtgtt 

tacgttgtct 

ttggagtaca 

aagccagtag 

atacttcaaa 

ttcatttgaa 

gttctggcag 

tagaagacac 

acaaggaatg 

gacaatcttg 

cttgtgaaag 

tcaacaaccc 

acctctgaag 

aagtagtgga 

aaatcctacc 

atacagaagg 

aagtcataga 

gtgtgacgtg 

aaaactaccg 

aagttgtagg 

caatgtcata 

cttaaaccat 

cagatgaagg 

tgttaaagta 

acacaagagt 

taggtcatga 

ggatcttatg 

gctgcttatg 

tggaaaacac 

aagcattacc 

attaagaaac 

ctaatgagct 

ttcactagcc 

ttaggtttaa 

aaacaattgc 

cactcatggt 

attgctgcaa 

ttaatagtgt 

tccttggagt 

aaaattttgg 

cttatgtcaa 

accattctta 

ggacaagcag 

caattacaac 

atcaaattgc 

gctaagagat 

tagcacaacg 

tgtgtttaac 

aattatatgc 

cttatgtgtt 

tacattattg 

ttccaattgt 

gtacttttac 

taaaagtacc 

aattctagaa 

ttagagcttc 

actacctaca 

actattgcta 

aaaatagtgt 

taagagtgtt 

gctaaattat 

gtttggatgc 

cggcattaat 

tatgtgaagt 

cacccaaatt 

ttctaaattg 

ttcacaatcg 

ctatgtggct 

attgttgtta 

agtatttgct 

taggttctct 

aatctgtgta 

actgctgctt 

ttggtgtact 

cttatctaat 

tttggtgctc 

cttcttattg 

taatggcgtt 

agagaattgt 

atcttaattc 

gtctaacgtt 

actactatgg 

atttctgtga 

aggttctttt 

ccttgcagca 

tttgtttaag 

tggattagac 

tcccttgatt 

cttatccagc 

tcttgaaacc 

attcaggtga 

cgatttcatc 

gtacaagcta 

gacttgacaa 

ttttaggtct 

ggccgctgag 

tgggttttgg 

catatatgtt 

gttcacaaaa 

ttcttttatt 

tattaggtct 

ttcagctata 

atgcaggtgt 

tctttggcta 

ttttgctagt 

catttcatca 

gcaattcttg 

gctcatgtgg 

tttatcatta 

gtattgtaca 

aatgg 





<210> 47 






<211> 1884 






<212> DNA 






<213> CORONAVIRUS 





<400> 47 






aattcttggc 

tcatgtggtt 

tatcattagt 

attgtacaaa 

tggcacccgt 

ttctgcaatg 

gttaggatgt 

acatcttctt 

tgcttctttc 

tactacatat 

ggaagagcta 

tgttcatatc 

atggatggtt 

gcacctcttc 

gacttgcatg 

atgtgctata 

agcgcaatcg 

tgccacacgc 

gttgagtgta 

caactattgt 

taatggcatg 

aagagatctt 

tctatgtcta 

tgcaaatgga 

ggccgtggct 

tctgcaagac 

tcacaattgg 

aattgtctca 

attgtgacac 

attttgcact 

ggtagtacat 

tcattagtga 

tgaagttgct 

cgtgatttgt 

cactccagtt 

taaaagacca 
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atcaacccta ctgaccagtc 
cttcacctct actttgacaa 
tttgtcaatt tagacaattt 
atagtttttg atggcaagtc 
tacagtcagc tgatgtgcca 
ggagatagta ctgaagtttc 
acttttagtg ttcctatgga 
gcaaagggtg tagctttaga 
gttgttgata ccgatgttga 
tctgacttag aagtgacagg 
gaaaacatga cgcccagaga 
gcccaagtag caaaaagtca 
ttatctgaac agctgcgtaa 
agactaactt gtgctacaac 
aagggtggta agattgttag 
gttcttgctg cattggtttg 
ggttacacaa atgaaatcat 
atttctactg atgattgttt 
cgtggtggtt catacaaaaa 
gagattggtt tcatagtgcc 
ttcttgcatt ttctacctcg 
aaactcattg agtatagtga 
atttttaagg atgctatggg 
ggttctattt cttatagtga 
atcatacagt ttcctaacac 
gctgagtact gtagacatgg 

<210> 48 
< 211 > 2020 
<212> DNA 

<213> CORONAVIRUS 
<400> 48 

cactcgttat gtgcttatgg 
ttctgttaga gtagtaacaa 
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atcgtatatt gttgatagtg ttgctgtgaa aaatggcgcg 
ggctggtcaa aagacctatg agagacatcc gctctcccat 
gagagctaac aacactaaag gttcactgcc tattaatgtc 
caaatgcgac gagtctgctt ctaagtctgc ttctgtgtac 
acctattctg ttgcttgacc aagctcttgt atcagacgtt 
cgttaagatg tttgatgctt atgtcgacac cttttcagca 
aaaacttaag gcacttgttg ctacagctca cagcgagtta 
tggtgtcctt tctacattcg tgtcagctgc ccgacaaggt 
cacaaaggat gttattgaat gtctcaaact ttcacatcac 
tgacagttgt aacaatttca tgctcaccta taataaggtt 
tcttggcgca tgtattgact gtaatgcaag gcatatcaat 
caatgtttca ctcatctgga atgtaaaaga ctacatgtct 
acaaattcgt agtgctgcca agaagaacaa catacctttt 
tagacaggtt gtcaatgtca taactactaa aatctcactc 
tacttgtttt aaacttatgc ttaaggccac attattgtgc 
ttatatcgtt atgccagtac atacattgtc aatccatgat 
tggttacaaa gccattcagg atggtgtcac tcgtgacatc 
tgcaaataaa catgctggtt ttgacgcatg gtttagccag 
tgacaaaagc tgccctgtag tagctgctat cattacaaga 
tggcttaccg ggtactgtgc tgagagcaat caatggtgac 
tgtttttagt gctgttggca acatttgcta cacaccttcc 
ttttgctacc tctgcttgcg ttcttgctgc tgagtgtaca 
caaacctgtg ccatattgtt atgacactaa tttgctagag 
gcttcgtcca gacactcgtt atgtgcttat ggatggttcc 
ttacctggag ggttctgtta gagtagtaac aacttttgat 
taca 


atggttccat catacagttt cctaacactt acctggaggg 
cttttgatgc tgagtactgt agacatggta catgcgaaag 
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gtcagaagta ggtatttgcc 
cagagctcta tcaggagttt 
tactcctctt gtgcaacctg 
tattattgcc atattggtga 
tggtgagtac aaccatgttg 
actctgtctg gtaccagctt 
cttgacattc tatttcacca 
gttttctcct attgtgcctt 
gcactgccat tggttcttta 
atttagtacc ttcgaggagg 
aaaattgcgt agcgagacac 
taacaagtac aagtatttca 
ctgccactta gcaaaggctc 
accaccacag acatcaatca 
cccgtcaggc aaagttgaag 
tggattgtgg ttggatgaca 
catgcttaat cctaactatg 
tcaggctggc aatgttcaac 
gcttaaagtt gatacttcta 
tggtcaaaca ttttcagttc 
tgccatgaga cctaatcata 
tggttttaac attgattatg 
aacaggagta cacgctggta 
acaaactgca caggctgcag 
gtatgctgct gttatcaatg 
tgactttaac cttgtggcaa 
catattggga cctctttctg 
gaaagagctg ctgcagaatg 
agatgagttt acaccatttg 
gttcaagaaa attgttaagg 
attgattctt gttcaaagta 
cttgccattt actcttggta 


tatctaccag tggtagatgg 
tctgtggtgt tgatgcgatg 
tgggtgcttt agatgtgtct 
cttgtgctgc ctactacttt 
ttgctgctaa tgcacttttg 
acagctttct gccgggagtc 
atgatgtttc attcttggct 
tttggataac agcaatctat 
acaactatct taggaaaaga 
ctgctttgtg tacctttttg 
tgttgccact tacacagtat 
gtggagcctt agatactacc 
taaatgactt tagcaactca 
cttctgctgt tctgcagagt 
ggtgcatggt acaagtaacc 
cagtatactg tccaagacat 
aagatctgct cattcgcaaa 
ttcgtgttat tggccattct 
accctaagac acccaagtat 
tagcatgcta caatggttca 
ccattaaagg ttctttcctt 
attgcgtgtc tttctgctat 
ctgacttaga aggtaaattc 
gtacagacac aaccataaca 
gtgataggtg gtttcttaat 
tgaagtacaa ctatgaacct 
ctcaaacagg aattgccgtc 
gtatgaatgg tcgtactatc 
atgttgttag acaatgctct 
gcactcatca ttggatgctt 
cacagtggtc actgtttttc 
ttatggcaat tgctgcatgt 


gttcttaata atgagcatta 
aatctcatag ctaacatctt 
gcttcagtag tggctggtgg 
atgaaattca gacgtgtttt 
tttttgatgt ctttcactat 
tactcagtct tttacttgta 
caccttcaat ggtttgccat 
gtattctgta tttctctgaa 
gtcatgttta atggagttac 
ctcaacaagg aaatgtacct 
aacaggtatc ttgctctata 
agctatcgtg aagcagcttg 
ggtgctgatg ttctctacca 
ggttttagga aaatggcatt 
tgtggaacta caactcttaa 
gtcatttgca cagcagaaga 
tccaaccata gctttcttgt 
atgcaaaatt gtctgcttag 
aaatttgtcc gtatccaacc 
ccatctggtg tttatcagtg 
aatggatcat gtggtagtgt 
atgcatcata tggagcttcc 
tatggtccat ttgttgacag 
ttaaatgttt tggcatggct 
agattcacca ctactttgaa 
ttgacacaag atcatgttga 
ttagatatgt gtgctgcttt 
cttggtagca ctattttaga 
ggtgttacct tccaaggtaa 
ttaactttct tgacatcact 
tttgtttacg agaatgcttt 


<210> 49 
<211> 2040 
<212> DNA 
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<213> CORONAVIRUS 
<400> 49 

agcatttcca gcctgaagac gtactgtagc 
taggttgttt aagcctttga tgaagtacaa 
tgtaacaaac ctacaaggtg gttccagttc 
agggaatcta gcccatttga gatcttggtg 
tcccttcgaa ttgttatagt aggcaagtgc 
accagccgca caggacatct gtcgtagtgc 
aacagctgag ttggctctta gagctgtaac 
gtccatgtta atttcactaa gttgaacaat 
ttcccagagt gcagatgcat atgtaaaggt 
ataatcaggg acaacaacca tgagtttggc 
aacacaacca tcacgcgcat tgttgataat 
aagcatagtg aagagcattg tttgcatagc 
tcttgcctgt ttgtacattt gggtcatagc 
catggcagca tcacggtcaa actcagattt 
gagaacgact tcagaatcac cattagctac 
ataagcggca tatgatggta aagaactaaa 
gttatcgagc atttcctcgc acaacctatt 
aacagacaaa agagaaacca tcttctcgaa 
atcattgtgg agttgtacac attgtgccca 
ttgaagaacc gagagcagta ccacagatgt 
agtagcaacc ttgatacatg gtttacctcc 
agcatcaata ctactcttag gaggcaaaag 
tgtagagacc aagtagtcat aaacaccaag 
gaaaaggcca aagtagcagc agcaacaata 
ctgtaaggtg ttgccagtaa taaataacaa 
agctctagct aaaaacatga tagtcgtaac 
aactaaggcc cacatggaaa tagcttgatc 
aagtgtaatg acattcatca gtgtccaaac 
agctgtcatg agaataagca aaactaaagc 
ataaccagac aagctagtgt cagccaattc 


agctaaactg cccagcacca tacctctatt 
gtatttcact ttaggccctt ttggtgtgtc 
tgtgtaaatt gtacctgtac catcactctt 
gtctgatagt aatgccagca caaacctacc 
attgtcatca gtacaagctg tttgtgtggt 
tactggactc agttcattat tctgtagttt 
aataagaggc caagccaaat ttggtgaatt 
cttgctatcc gcatcaacaa cttgctggat 
gttaccatca caagtgttct tgtaggtacc 
tgctgtagtc aatggtatga tgttgagtgg 
gttgttaagt gcatcattat caagcttcct 
actagttact tttgccctct tgtcctcaga 
ctgatctgcc atcttttcca acttgcgttg 
agccacattc aaagatttct ttaacttttt 
agcctgctca taggcctcct gggcagtggc 
ttctgaagca atagcctgaa gagtagcacg 
aatgtctaca gcaccctgca tggatagcaa 
agcttcagtt gtgtcttttg caagaagaat 
caatttagaa gatgactcta ctctaagttg 
gcactttacg tcagacattt tagactgtac 
aatacccaac aacttaatgt taagcttgaa 
cccctgggag ttcatatacc taaattcttg 
agtaagcctg aagtaacggt tgagtaaaca 
gcctaagaaa caataaacaa gcatgataca 
tgggtaatac tcaacacaca caaacactat 
gacaccagaa tagttagagg ttacagaaat 
taaagcatta ccatagtaga ctttgtaaac 
acgtctagca gcatcatcat aaacagtgcg 
tgaagcatac ataacacaat ccttaagcct 
aagccatgtc atgatacgca tcacccagct 
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agcaggcatg tagaccatat taaagtaagc 
gcacaagaat gcgtgcttat gcttaacaag 
accaagagta aatggcaaga aagcattctc 
actttgaaca agaatcaata gtgatgtcaa 

<210> 50 
< 211 > 2012 
<212> DNA 

<213> CORONAVIRUS 
<400> 50 

cttgtaggtt tgttacagac acaccaaaag 
aaggcttaaa caacctaaat agaggtatgg 
ttcaggctgg aaatgctaca gaagtacctg 
ttgcagtaga ccctgctaaa gcatataagg 
ccaactgtgt gaagatgttg tgtacacaca 
cagaagctaa catggaccaa gagtcctttg 
gccacattga ccatccaaat cctaaaggat 
tacctaccac ttgtgctaat gacccagtgg 
tctgcggaat gtggaaaggt tatggctgta 
agtctgcgga tgcatcaacg tttttaaacg 
accgtgcggc acaggcacta gtactgatgt 
aaaagttgct ggttttgcaa agttcctaaa 
tgaggaaggc aatttattag actcttactt 
ccaacatgaa gagactattt ataacttggt 
ctttttcaag tttagagtag atggtgacat 
taaatacaca atggctgatt tagtctatgc 
tacattaaaa gaaatactcg tcacatacaa 
ggattggtat gacttcgtag agaatcctga 
gcgtgtacgc caatcattat taaagactgt 
cattgtaggc gtactgacat tagataatca 
tgatttcgta caagtagcac caggctgcgg 
gctgatgccc atcctcactt tgactagggc 
tctcgcaaaa ccacttatta agtgggattt 
ttgtctcttc gaccgttatt ttaaatattg 


aactgttgca agagaaggta acagaaacaa 
cagcatagca catgcagcaa ttgccataat 
gtaaacaaag aaaaacagtg accactgtgt 
gaaagttaaa agcatccaat gatgagtgca 


ggcctaaagt gaaatacttg tacttcatca 
tgctgggcag tttagctgct acagtacgtc 
ccaattcaac tgtgctttcc ttctgtgctt 
attacctagc aagtggagga caaccaatca 
ctggtacagg acaggcaatt actgtaacac 
gtggtgcttc atgttgtctg tattgtagat 
tctgtgactt gaaaggtaag tacgtccaaa 
gttttacact tagaaacaca gtctgtaccg 
gttgtgacca actccgcgaa cccttgatgc 
ggtttgcggt gtaagtgcag cccgtcttac 
cgtctacagg gcttttgata tttacaacga 
aactaattgc tgtcgcttcc aggagaagga 
tgtagttaag aggcatacta tgtctaacta 
taaagattgt ccagcggttg ctgtccatga 
ggtaccacat atatcacgtc agcgtctaac 
tctacgtcat tttgatgagg gtaattgtga 
ttgctgtgat gatgattatt tcaataagaa 
catcttacgc gtatatgcta acttaggtga 
acaattctgc gatgctatgc gtgatgcagg 
ggatcttaat gggaactggt acgatttcgg 
agttcctatt gtggattcat attactcatt 
attggctgct gagtcccata tggatgctga 
gctgaaatat gattttacgg aagagagact 
ggaccagaca taccatccca attgtattaa 
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ctgtttggat gataggtgta tccttcattg 
gtttccacct acaagttttg gaccactagt 
tgttgtttca actggatacc attttcgtga 
cttacatagc tcgcgtctca gtttcaagga 
gcatgcagct tctggcaatt tattgctaga 
actaacaaac aatgttgctt ttcaaactgt 
tgactttgct gtgtctaaag gtttctttaa 
cttctttgct caggatggca acgctgctat 
gccaacaatg tgtgatatca gacaactcct 
tgattgttac gatggtggct gtattaatgc 

<210>51 
<211> 1877 
<212> DNA 

<213> CORONAVIRUS 
<400>51 

gtacttcgcg tacagtggca ataccatatg 
gcgtttctgc tgcgaaaagc ttgagtctct 
cagcattagt ccaatcacat gttgctatcg 
cacatgtgtt tttgtataaa ccaaaaacct 
gaggcttatg tgacttgcaa taatagctca 
tgacatcaca acctggggca ttgcaaacat 
atgttgaaat gacatggtca tagcagcact 
caccgcaacg aagtgaagtc tgtgaattgc 
ctgtatgtgg tgtgtacata gcctcataaa 
cattagttag cattacggaa tacatgtcca 
ttctaatgta ttgtaaatac aagtgaaaga 
taagtgggta agcatcaata gccagtgaca 
ttttgacaat atcatcgaca aaacagcctg 
gcaggtacac gtaatcatct ccttgtttaa 
gaggtccttt agtaaggtca gtctcagtcc 
tttgataata aagaactgcc ttaaagttct 
agttactgtt atagcacaca acggcatcat 
gcaggtaagc gtaaaactca tccacgaatt 


tgcaaacttt aatgtgttat tttctactgt 
aagaaaaata tttgtagatg gtgttccttt 
gttaggagtc gtacataatc aggatgtaaa 
acttttagtg tatgctgctg atccagctat 
taaacgcact acatgctttt cagtagctgc 
caaacccggt aattttaata aagactttta 
ggaaggaagt tctgttgaac taaaacactt 
cagtgattat gactattatc gttataatct 
attcgtagtt gaagttgttg ataaatactt 
ca 


acagcttaaa tgtttcctca gtggctttga 
cagtacaagt gttggcaagt atgtaatcgc 
cattgaagtc agtgacattg tcactgccta 
gaccattagc acataatgga aaactaatgg 
tacctcctag atacagttgt gtcacatcag 
agggattaac agacaacact aatttgtgtg 
tgcaacatag gaatggtctc ctaatacagg 
acaatacaca agcacctaca gcctgcaaga 
actcaggttc ccagtaccgt gaggtgttat 
acatgtggcc agtaagctca tcatgtaact 
catcagcata ctcctgatta ggatgttttg 
cgaacctttc aatcataagt gtaccatctg 
cgcctaatat tcttgatgga tctgggtaag 
ctagcattgt atgctgtgag caaaattcgt 
aacattttgc ctcagacatg aacacattat 
taatgctagc tactaaacct tgagccgcat 
cagaaagaat catcatggag aaatgtttac 
catgatcaac atccctattt ctatagagac 
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actcatagag cctgtgttgt agattgcgga 
ttgaaagaag tgcatttaca ttggctgtaa 
cataagcagt tgtagcatca ccggatgatg 
cacacatgac catctcactt aatacttgcg 
gtgataagtt acagcaagtg ttatgtttgc 
gcatgttagg catggctctg tcacattttg 
ctacatcact gtaaacagtt tttaacatat 
caattaccac agtagctcct ctagtggcgg 
gtctatttgt catagtacta cagatagaga 
cactaatggc atacttaaga ttcatttgag 
acgcgaaaag tgcatcttga tcctcataac 
cccatttatt aaatgggaaa ccagctgatt 
cattaataca gccaccatcg taacaatcaa 
ggagttgtct gatatca 

<210> 52 
<211> 2051 
<212> DNA 

<213> CORONAVIRUS 
<400> 52 

tcaggtccaa tcttgacaaa gtacttcatt 
acgaacacga ctctgtctga caatcctttc 
atacgcacta cattccaggg caagccttta 
tcacctggtg gaggttttgc attaactctg 
taaccagtcg gtacagctac taagttaaca 
ttagtaccca cagcatctct agttgcatga 
cgaacgtgac gaatagcttc ttcgcgggtg 
taattcattt tgaaacccat catagagatg 
cctggtatgt caacacataa tccttcagtc 
ggtgcctgtg taggatgaag accagtaatg 
acattttctg cttgtaatgt agccacattg 
agtttgtcat aaagatctct atcagacatt 
atagccacat tgaagcggtt gacattacaa 
atgacatagt catattcaga accctgtgat 


catacttgtc agctatctta ttaccatcag 
cagcttgaca aatgttaaag acactattag 
ttccacctgg tttaacatat agtgagccgc 
cacactcgtt agctaacctg tagaaacggt 
gagcaagaac aagagaggcc attatcctaa 
gataatccca acccataagg tgtggagttt 
tatgccagcc accgtaaaac ttgcttgttc 
ctattgactt caataatttc tgatgaaact 
caccagctac ggtgcgagct ctattctttg 
ttatagtagg gatgacatta cgcttagtat 
tcattgagtc ataataaagt ctagccttac 
tatccagatt gttaacgatt acttggttgg 
agtatttatc aacaacttca actacgaata 


gatgtaagct caaagccatg cgcccaaagg 
agtgtatcac tgagcatttg tactatctta 
tacatgagtg gtataagatg tttaaactgg 
gtgaattctg tgttattttc agtgtcaaca 
cctgtagaaa atcctagctg gagaggtagg 
cagccctcta catcaaagcc aatccacgca 
ataaacatat tagggtaacc attgacttgg 
agtctacggt aggtcatgtc ctttggtatg 
ttgaacttta tatcaacgct gaggtgtgta 
atcttactac agtccttaaa aagtccagtt 
cgacgtggta tttctagact tgtaaattgc 
atgcacaaaa tgccaatttt tgcccttgtg 
gagtgtgctg tttcagtagt ttgtgtgaat 
gaatcaacag tctgcgtagg caatcctaag 
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atttttgaag 

ctacagcgtt 

ctgtgaatta 

taaggtgaga 

taaaaacagc 

ttttctccaa 

gcaggattgc 

gtgtaagaaa 

ttctcttaca 

acgcctattt 

gaggtctgtt 

gattgcagat 

gaaacatcat 

gtgtaataac 

acctttgtag 

aacattttga 

agcattgagc 

tgacttatcc 

ttgtgtgctt 

ttagcttatt 

gtcataaact 

aaagcactca 

cagtgtcaac 

aatttcagca 

ggacaacggc 

gacaagttcc 

aaggaacatg 

tctggaccta 

ttgttttcat 

aagtctgcac 

actgaattaa 

aatattctgg 

ttctagtgtg 

cctttagtca 

gcaatgtgcg 

gggggctggt 

aattgagcag 

gatcgccaat 

atagacgtag 

tgttttgcac 

gaagtctagc 

attgacaaca 

ctcaagtcat 

aattagtagc 

catagagatt 

tcatcaaaga 

ctacaatgtc 

agcagttgtt 

tctggcaatg 

catttacagt 

gcagaaaaca 

tactgttcta 

gtgttgaatt 

cactttgaat 

ttatcaaaac 

actctacgcg 

cgcacgcgca 

ggtatgattc 

tactacattt 

atctatgggc 

aaatatttta 

atgccttttc 

acatagggca 

tcaacagctg 

catgagagca 

tgccgtatac 

actatgcgag 

cagatgggta 

atagagagca 

agtccgatgg 

caaaatgact 

cttaccagta 

ccaggtggtc 

cttggagtgt 

agagtacttt 

tgcatgccga 

ccttttgata 

atttgcaaca 

ttgctagaaa 

actcatctga 

gatgttgagt 

gttgggtaca 

agccagtaat 

tctcacatag 

tgctcttgtg 

gcactagagt 

aggtgcacta 

agtggcatta 

cagtgtgaga 

tgtcaacaca 

aagtaatcac 

caacattcaa 

cttgtatgtc 

gtagtacctc 

tgtacacaac 

agcatcacca 

tagtcacctt 

tttcaaaggt 

gtactctcca 

atctgtactt 

tactattttt 

agttacacgg 

taaccagtaa 

agacatagtt 

tctgttcaat 

ggtggtctag 

gttttccaac 

ctcccatgaa 

agatgcaatt 

ctctgtcaga 

gagtacttcg 

cgtacagtgg 

caataccata 

tgacagctta 

aatgtttcct 

cagtggcttt 

gagcgtttct 

gctgcgaaaa 

gcttgagtct 

ctcagtacaa 

gtgttggcaa 

g 





<210> 53 

<211> 2075 

<212> DNA 

<213> CORONAVIRUS 





<400> 53 






tgcttgtagt 

tttgggtaga 

aggtttcaac 

atgtccatcc 

ttacaccaaa 

gcatgaatga 

aatttcagca 

tagtcaattg 

taaccttgac 

cacttttgaa 

atcactgaca 

aatcttgtga 

ctttattatc 

tcgacaaagt 

catcaagtaa 

aagatcaatc 

acagaacaca 

cacattttga 

tgaacctgtt 

tgcgcatctg 

ttatgaagta 

atttttcact 

gtgctgtcca 

tagggataaa 

atcctctaat 

ttaagtggtg 

aatcttgtga 

gcgcttggct 

aagcctatca 

ttaaatgaag 

accgccaagt 

tgtccatgac 

tgaaatctcc 

ataaacgatg 

tgttcgaagg 

catagccctc 

gagcttatat 

cgctgtatga 

attcatccat 

agcgagctcg 

agaaagtcag 

tttccatttg 


147 


5 

10 

15 

20 

25 

30 

35 

40 

45 

50 

55 


480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2075 


EP 1 694 829 B1 


tgatctgggc ttaaaatcct ctaagtctct 
ttgaataatg ccgtctactt tcttaaagta 
taatgtgact ccattgacgc tagcttgtgc 
tgaaccttct gttattaaaa caccattacg 
cactctacca tcaaacaaga cagtaagtga 
aatgtcagtc attgtgcaga cacctattgt 
gtcccagatt acagtattag cagcgatatc 
tggcactggt ttaatgttac gcttagccca 
tgtcttattt tcaaagatct ccacatcaat 
aatgatggaa acaggtgctt cgccggcgtg 
ataagccaca ttttctaaac tctgtaacct 
aaattgtttg taaatccata ggctaaatcc 
gtactgtcgg tactcatttg catggtgtct 
aatacacgta gcagatttga gtggaacata 
agactcacaa ggactatcag aatagtaaaa 
acttttatcg aaagctggag tgtggaatgc 
acagcctggt aagttcaagt ttgacaagac 
ggctgggtaa cgatcaacgt tacaattcca 
gtgatgtgta gcataagaat agaagagttc 
ctgagcatcg tagaacttcc attctacttc 
atttccaatg tcatgaagaa ctggaaactt 
gtgttgtact tttctgcaag cagaattaac 
aacagaccaa tcaacgcgct taacaaagca 
agcatcacaa ctagccacat gtgcatttcc 
ctgaaggtta cccgtaaagc cccactgctg 
gtcaaaaccc acagaatgat tccagcaggc 
tgcacgtttg tcacacagac aacacgttct 
tgatgtaagc tcaaagccat gcgcccaaag 


gctctgagta aagtaggttt caggcaactg 
gttaaactgt gtttttactg attctccaat 
tggtcccttt gaaggtgtta gacctttgac 
ggcgtttcta aaaaggtcta cctgtccttc 
agaacaagca ctctcagtag gtttcttggc 
agatacatgt gctggggctt ctcttttgta 
aacacccaaa ttattgagta tcttaatctc 
aagctcaaat gcaacattaa caggaagtgt 
accatctacc tttgtgtaaa cagcattatt 
tccatcaaag tgtcctttat taacaacatt 
ggtaaatgta ttccacaggt tataagtatc 
agcagaaatc atcatattat atgcatccaa 
gcaaacagca ccacctaaat tgcatcgtgt 
atcaatatcc gacactactt gtttgccatg 
gaaaggcaat tgctttaaat tagtaaatgc 
atgcttattc acatacaaac taccaccatc 
tcttgtgtca aacctacaca caattgcatt 
aaacaaacaa acaccatcag tgaatttatc 
ctctattttg taagctttgt cactacatgg 
agcctgaggc acacacttga tagcctttgg 
atcagcaagc aatgcagact tcacaaccat 
cctcagttca tctcctataa tagggtattc 
ctcatggact gctaaacatc tagtcatgat 
atgtacctgg caatgttggt catggttact 
aacatcaatc ataaatgggt tatagacata 
ataagtatct gatgaagtag aaaagcaagt 
ttcaggtcca atcttgacaa agtacttcat 
gacga 


<210> 54 
<211> 1891 
<212> DNA 

<213> CORONAVIRUS 
<400> 54 
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aagattcacc acttaaatta 
tcataacaga tgcgcaaaca 
ttgatgactt tgtcgagata 
aggttacaat tgactatgct 
aaaccttcta cccaaaacta 
acttgtacaa gatgcaaaga 
atgctgttat accaaaagga 
acttaaatac acttacttta 
gctctgataa aggagttgca 
cactacttgt cgattcagat 
gagactgtgc aacagtacat 
accctaggac caaacatgtg 
tgtgtggatt tataaagcaa 
agcattcttg gaatgctgac 
ttgttacaaa tgtaaatgca 
gcaagccgaa ggaacaaatt 
acacaaatcc tatccagttg 
aattaagagg aactgctgta 
ctcttctgga aaaaggtagg 
atattcttgt taacaactaa 
gtggtagtga ccttgaccgg 
aacatacttc atctatgagg 
tttatttaac tcaggattta 
ttaatcatac gtttggcaac 
cagagaaatc aaatgttgtc 
agtcggtgat tattattaac 
tgtgtgacaa ccctttcttt 
tattcgataa tgcatttaat 
tttcagaaaa gtcaggtaat 
ggtttctcta tgtttataag 
gttttaacac tttgaaacct 
gagccattct tacagccttt 

<210> 55 
<211> 32 
<212> DNA 


gaggatttta tccctatgga 
ggttcatcaa aatgtgtgtg 
ataaagtcac aagatttgtc 
gaaatttcat tcatgctttg 
caagcaagtc aagcgtggca 
atgcttcttg aaaagtgtga 
ataatgatga atgtcgcaaa 
gctgtaccct acaacatgag 
ccaggtacag ctgtgctcag 
cttaatgact tcgtctccga 
acggctaata aatgggacct 
acaaaagaga atgactctaa 
aaactagccc tgggtggttc 
ctttacaagc ttatgggcca 
tcatcatcgg aagcattttt 
gatggctata ccatgcatgc 
tcttcctatt cactctttga 
atgtctctta aggagaatca 
cttatcatta gagaaaacaa 
acgaacatgt ttattttctt 
tgcaccactt ttgatgatgt 
ggggtttact atcctgatga 
tttcttccat tttattctaa 
cctgtcatac cttttaagga 
cgtggttggg tttttggttc 
aattctacta atgttgttat 
gctgtttcta aacccatggg 
tgcactttcg agtacatatc 
tttaaacact tacgagagtt 
ggctatcaac ctatagatgt 
atttttaagt tgcctcttgg 
tcacctgctc a 


cagcacagtg aaaaattact 
ttctgtgatt gatcttttac 
agtgatttca aaagtggtca 
gtgtaaggat ggacatgttg 
accaggtgtt gcgatgccta 
ccttcagaat tatggtgaaa 
gtatactcaa ctgtgtcaat 
agttattcac tttggtgctg 
acaatggttg ccaactggca 
cgcagattct actttaattg 
tattattagc gatatgtatg 
agaagggttt ttcacttatc 
tatagctgta aagataacag 
tttctcatgg tggacagctt 
aattggggct aactatcttg 
taactacatt ttctggagga 
catgagcaaa tttcctctta 
aatcaatgat atgatttatt 
cagagttgtg gtttcaagtg 
attatttctt actctcacta 
tcaagctcct aattacactc 
aatttttaga tcagacactc 
tgttacaggg tttcatacta 
tggtatttat tttgctgcca 
taccatgaac aacaagtcac 
acgagcatgt aactttgaat 
tacacagaca catactatga 
tgatgccttt tcgcttgatg 
tgtgtttaaa aataaagatg 
agttcgtgat ctaccttctg 
tattaacatt acaaatttta 
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<213> ARTIFICIAL SEQUENCE 
< 220 > 

<223> amorce N sens 
<400> 55 

cccatatgtc tgataatgga ccccaatcaa ac 32 

<210> 56 
<211> 32 
<212> DNA 

<213> artificial sequence 
< 220 > 

<223> amorce N antisens 
<400> 56 

cccccgggtg cctgagttga atcagcagaa gc 32 

<210> 57 
<211 > 31 
<212> DNA 

<213> artificial sequence 
< 220 > 

<223> amorce Sc sens 
<400> 57 

cccatatgag tgaccttgac cggtgcacca c 31 

<210> 58 
<211> 30 
<212> DNA 

<213> artificial sequence 
< 220 > 

<223> amorce SL sens 
<400> 58 

cccatatgaa accttgcacc ccacctgctc 30 

<210> 59 
<211> 33 
<212> DNA 

<213> amorce Sc et SL antisens 
<400> 59 

cccccgggtt taatatattg ctcatatttt ccc 33 

<210> 60 
<211> 16 
<212> DNA 

<213> amorce sens serie 1 
<400> 60 

ggcatcgtat gggttg 16 

<210> 61 
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<211> 16 
<212> DNA 

<213> amorce antisens serie 2 (28774-28759) 

<400>61 

cagtttcacc acctcc 16 

<210> 62 
<211> 16 
<212> DNA 

<213> amorce sens serie 2 (28375-28390) 

<400> 62 

ggctactacc gaagag 16 

<210> 63 
<211> 16 
<212> DNA 

<213> amorce antisens serie 2 (28702-28687) 

<400> 63 

aattaccgcgactacg 16 

<210> 64 
<211> 26 
<212> DNA 

<213> sonde 1/serie 1 (28561-28586) 

<400> 64 

ggcacccgca atcctaataa caatgc 26 

<210> 65 
< 211>21 
<212> DNA 

<213> sonde 2/serie 1 (28588-28608) 

<400> 65 

gccaccgtgc tacaacttcc t 21 

< 210 > 66 
<211> 23 
<212> DNA 

<213> sonde 1/serie 2 /sonde N/FL (28541-28563) 

<400> 66 

atacacccaa agaccacatt ggc 23 

<210> 67 
<211> 25 
<212> DNA 

<213> sonde 2/serie 2/sonde SARS/N/LC705 (28565-28589) 
<400> 67 

cccgcaatcc taataacaat gctgc 25 

< 210 > 68 
<211> 30 
<212> DNA 
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<213> artificial sequence 
< 220 > 

<223> amorce ancre 14T 
<400> 68 

agatgaattc ggtacctttt tttttttttt 30 

<210> 69 
<211> 13 
<212> PRT 

<213> artificial sequence 
< 220 > 

<223> peptide M2-14 
<400> 69 


Ala Asp Asn Gly Thr lie Thr Val Glu Glu Leu Lys Gin 
1 5 10 


<210> 70 
< 211 > 12 
<212> PRT 

<213> artificial sequence 
< 220 > 

<223> peptide El-12 
<400> 70 


Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu 
15 10 


<210>71 
<211> 24 
<212> PRT 

<213> artificial sequence 
< 220 > 

<223> peptide E53-72 
<400>71 


Lys Pro Thr Val Tyr Val Tyr Ser Arg Val Lys Asn Leu Asn Ser Ser 
15 10 15 


Glu Gly val Pro Asp Leu Leu val 
20 

<210> 72 
<211> 153 
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<212> DNA 

<213> CORONAVIRUS 
<400> 72 


10 


gatattaggt ttttacctac ccaggaaaag ccaaccaacc tcgatctctt 
tctctaaacg aactttaaaa tctgtgtagc tgtcgctcgg ctgcatgcct 
cgcagtataa acaataataa attttactgt cgt 


gtagatctgt 

agtgcaccta 


<210> 73 
<211> 410 
15 <212> DNA 

<213> CORONAVIRUS 

<400> 73 


ttctccagac aacttcaaaa ttccatgagt ggagcttctg ctgattcaac tcaggcataa 
acactcatga tgaccacaca aggcagatgg gctatgtaaa cgttttcgca attccgttta 
cgatacatag tctactcttg tgcagaatga attctcgtaa ctaaacagca caagtaggtt 
tagttaactt taatctcaca tagcaatctt taatcaatgt gtaacattag ggaggacttg 
aaagagccac cacattttca tcgaggccac gcggagtacg atcgagggta cagtgaataa 
tgctagggag agctgcctat atggaagagc cctaatgtgt aaaattaatt ttagtagtgc 
tatccccatg tgattttaat agcttcttag gagaatgaca aaaaaaaaaa 


<210> 74 
<211 >4382 
35 <212> PRT 

<213> CORONAVIRUS 

<400> 74 


40 


Met 

Glu 

ser Leu 

Val 

Leu 

Gly 

Val 

Asn Glu 

Lys 

Thr 

His 

val Gln 

Leu 

1 



5 



10 



15 


Ser 

Leu 

pro val 

Leu 

Gin 

Val 

Arg 

Asp Val 

Leu 

val 

Arg 

Gly Phe 

Gly 

45 


20 




25 




30 



60 

120 

153 


60 

120 

180 

240 

300 

360 

410 


50 
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Asp 

ser 

val 

Glu 

Glu 

Ala 

Leu 

Ser 

Glu 

Ala 

Arg 

Glu 

His 

Leu 

Lys 

Asn 


35 





40 




45 




Gly 

Thr 

50 

cys 

Gly 

Leu 

Val 

Glu 

55 

Leu 

Glu 

Lys 

Gly 

val 

60 

Leu 

Pro 

Gin 

Leu 

Glu 

Gin 

Pro 

Tyr 

Val 

Phe 

lie 

Lys 

Arg 

ser 

Asp 

Ala 

Leu 

Ser 

Thr 

Asn 

65 




70 




75 





80 

His 

Gly 

His 

Lys 

val 

Val 

Glu 

Leu 

Val 

Ala 

Glu 

Met 

Asp 

Gly 

lie 

Gin 




85 





90 





95 


Tyr 

Gly 

Arg 

Ser 

100 

Gly 

lie 

Thr 

Leu 

Gly 

105 

val 

Leu 

val 

Pro 

His 

110 

Val 

Gly 

Glu 

Thr 

Pro 

lie 

Ala 

Tyr 

Arg 

Asn 

Val 

Leu 

Leu 

Arg 

Lys 

Asn 

Gly 

Asn 



115 



120 




125 




Lys 

Gly 

Ala 

Gly 

Gly 

His 

Ser 

Tyr 

Gly 

lie 

Asp 

Leu 

Lys 

ser 

Tyr 

Asp 

130 




135 





140 





Leu 

Gly 

Asp 

Glu 

Leu 

Gly 

Thr 

Asp 

Pro 

lie 

GlU 

Asp 

Tyr 

Glu 

Gin 

Asn 

145 



150 




155 





160 

Trp 

Asn 

Thr 

Lys 

His 

Gly 

Ser 

Gly 

Ala 

Leu 

Arg 

Glu 

Leu 

Thr 

Arg 

Glu 



165 





170 





175 


Leu 

Asn 

Gly 

Gly 

Ala 

val 

Thr 

Arg 

Tyr 

val 

Asp 

Asn 

Asn 

phe 

cys 

Gly 



180 




185 





190 



Pro 

Asp 

Gly 

Tyr 

Pro 

Leu 

Asp 

cys 

lie 

Lys 

Asp 

Phe 

Leu 

Ala 

Arg 

Ala 


195 




200 





205 




Gly 

Lys 

Ser 

Met 

cys 

Thr 

Leu 

ser 

Glu 

Gin 

Leu 

Asp 

Tyr 

lie 

Glu 

ser 

210 




215 





220 





Lys 

Arg 

Gly 

Val 

Tyr 

cys 

Cys 

Arg 

Asp 

His 

Glu 

His 

Glu 

lie 

Ala 

Trp 

225 


230 





235 





240 

Phe 

Thr 

Glu 

Arg 

Ser 

Asp 

Lys 

ser 

Tyr 

Glu 

His 

Gin 

Thr 

Pro 

phe 

Glu 




245 



250 





255 


lie 

Lys 

Ser 

Ala 

Lys 

Lys 

Phe 

Asp 

Thr 

Phe 

Lys 

Gly 

Glu 

Cys 

Pro 

Lys 



260 




265 





270 



Phe 

val 

Phe 

Pro 

Leu 

Asn 

ser 

Lys 

val 

Lys 

val 

lie 

Gin 

Pro 

Arg 

val 



275 





280 




285 




Glu 

Lys 

Lys 

Lys 

Thr 

Glu 

Gly 

Phe 

Met 

Gly 

Arg 

lie 

Arg 

Ser 

Val 

Tyr 


290 



295 





300 
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Pro Val Ala Ser Pro Gin Glu Cys Asn Asn Met His Leu Ser Thr Leu 
305 310 315 320 


Met Lys cys Asn His Cys Asp Glu val ser Trp Gin Thr cys Asp Phe 
325 330 335 


Leu Lys Ala Thr Cys Glu His Cys Gly Thr Glu Asn Leu val lie Glu 
340 345 350 


Gly pro Thr Thr Cys Gly Tyr Leu Pro Thr Asn Ala Val val Lys Met 
355 360 365 


Pro Cys Pro Ala Cys Gin Asp Pro Glu lie Gly Pro Glu His Ser Val 
370 375 380 


Ala Asp Tyr His Asn His Ser Asn lie Glu Thr Arg Leu Arg Lys Gly 
385 390 395 400 


Gly Arg Thr Arg Cys Phe Gly Gly cys val Phe Ala Tyr val Gly cys 
405 410 415 


Tyr Asn Lys Arg Ala Tyr Trp val Pro Arg Ala Ser Ala Asp lie Gly 
420 425 430 


ser Gly His Thr Gly lie Thr Gly Asp Asn val Glu Thr Leu Asn Glu 
435 440 445 


Asp Leu Leu Glu lie Leu Ser Arg Glu Arg Val Asn lie Asn lie Val 
450 455 460 


Gly Asp Phe His Leu Asn Glu Glu val Ala lie lie Leu Ala Ser Phe 
465 470 475 480 


ser Ala Ser Thr Ser Ala Phe lie Asp Thr lie Lys Ser Leu Asp Tyr 
485 490 495 


Lys ser Phe Lys Thr lie Val Glu Ser Cys Gly Asn Tyr Lys Val Thr 
500 505 510 


Lys Gly Lys Pro Val Lys Gly Ala Trp Asn lie Gly Gin Gin Arg ser 
515 520 525 


Val Leu Thr Pro Leu cys Gly Phe Pro Ser Gin Ala Ala Gly val lie 
530 535 540 


Arg ser lie Phe Ala Arg Thr Leu Asp Ala Ala Asn His Ser lie Pro 
545 550 555 560 


Asp Leu Gin Arg Ala Ala Val Thr lie Leu Asp Gly lie Ser Glu Gin 
565 570 575 
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Ser Leu Arg Leu val Asp Ala Met val Tyr Thr Ser Asp Leu Leu Thr 
580 585 590 


Asn ser Val lie lie Met Ala Tyr val Thr Gly Gly Leu Val Gin Gin 
595 600 605 


Thr Ser Gin Trp Leu Ser Asn Leu Leu Gly Thr Thr val Glu Lys Leu 
610 615 620 


Arq Pro lie Phe Glu Trp lie Glu Ala Lys Leu Ser Ala Gly Val Glu 
625 630 635 640 


Phe Leu Lys Asp Ala Trp Glu lie Leu Lys Phe Leu lie Thr Gly Val 
645 650 655 


Phe Asp lie val Lys Gly Gin lie Gin val Ala Ser Asp Asn lie Lys 
660 665 670 


Asp Cys Val Lys Cys Phe lie Asp val val Asn Lys Ala Leu Glu Met 
675 680 685 


Cys lie Asp Gin Val Thr lie Ala Gly Ala Lys Leu Arg Ser Leu Asn 
690 695 700 


Leu Gly Glu Val Phe lie Ala Gin Ser Lys Gly Leu Tyr Arg Gin Cys 
705 710 715 720 


lie Arg Gly Lys Glu Gin Leu Gin Leu Leu Met Pro Leu Lys Ala Pro 
725 730 735 


Lys Glu val Thr Phe Leu Glu Gly Asp ser His Asp Thr val Leu Thr 
740 745 750 


Ser Glu Glu val Val Leu Lys Asn Gly Glu Leu Glu Ala Leu Glu Thr 
755 760 765 


Pro val Asp ser Phe Thr Asn Gly Ala lie val Gly Thr Pro val Cys 
770 775 780 


Val Asn Gly Leu Met Leu Leu Glu lie Lys Asp Lys Glu Gin Tyr Cys 
785 790 795 800 


Ala Leu Ser Pro Gly Leu Leu Ala Thr Asn Asn val Phe Arg Leu Lys 
805 810 815 


Gly Gly Ala Pro lie Lys Gly Val Thr Phe Gly Glu Asp Thr Val Trp 
820 825 830 


Glu val Gin Gly Tyr Lys Asn val Arg lie Thr Phe Glu Leu Asp Glu 
835 840 845 
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Arg Val Asp Lys Val Leu Asn Glu Lys Cys Ser Val Tyr Thr val Glu 
850 855 860 


Ser Gly Thr Glu Val Thr Glu Phe Ala cys Val Val Ala Glu Ala Val 
865 870 875 880 


Val Lys Thr Leu Gin Pro Val ser Asp Leu Leu Thr Asn Met Gly lie 
885 890 895 


Asp Leu Asp Glu Trp ser val Ala Thr phe Tyr Leu Phe Asp Asp Ala 
900 905 910 


Gly Glu Glu Asn Phe Ser ser Arg Met Tyr Cys Ser Phe Tyr Pro Pro 
915 920 925 


Asp Glu Glu Glu Glu Asp Asp Ala GlU Cys GlU Glu Glu GlU lie Asp 
930 935 940 


Glu Thr Cys Glu His Glu Tyr Gly Thr Glu Asp Asp Tyr Gin Gly Leu 
945 950 955 960 


Pro Leu Glu Phe Gly Ala ser Ala Glu Thr val Arg Val Glu Glu Glu 
965 970 975 


Glu Glu Glu Asp Trp Leu Asp Asp Thr Thr Glu Gin Ser Glu lie Glu 
980 985 990 


Pro Glu Pro Glu Pro Thr Pro Glu Glu Pro val Asn Gin Phe Thr Gly 
995 1000 1005 


Tyr Leu Lys Leu Thr Asp Asn Val Ala lie Lys Cys Val Asp lie 
1010 1015 1020 


Val Lys Glu Ala Gin Ser Ala Asn Pro Met Val lie val Asn Ala 
1025 1030 1035 


Ala Asn lie His Leu Lys His Gly Gly Gly val Ala Gly Ala Leu 
1040 1045 1050 


Asn Lys Ala Thr Asn Gly Ala Met Gin Lys Glu Ser Asp Asp Tyr 
1055 1060 1065 


He Lys Leu Asn Gly Pro Leu Thr val Gly Gly ser cys Leu Leu 
1070 1075 1080 


Ser Gly His Asn Leu Ala Lys Lys Cys Leu His Val val Gly Pro 
1085 1090 1095 


Asn Leu Asn Ala Gly Glu Asp lie Gin Leu Leu Lys Ala Ala Tyr 
1100 1105 1110 
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Glu 

Asn 

1115 

Phe 

Asn 

Ser 

Gin 

Asp 

1120 

lie 

Leu 

Leu 

Ala 

Pro 

1125 

Leu 

Leu 

Ser 

Ala 

Gly 

1130 

lie 

Phe 

Gly 

Ala 

Lys 

1135 

Pro 

Leu 

Gin 

ser 

Leu 

1140 

Gin 

Val 

Cys 

Val 

Gin 

1145 

Thr 

val 

Arg 

Thr 

Gin 

1150 

val 

Tyr 

lie 

Ala 

val 

1155 

Asn 

Asp 

Lys 

Ala 

Leu 

1160 

Tyr 

Glu 

Gin 

val 

val 

1165 

Met 

Asp 

Tyr 

Leu 

Asp 

1170 

Asn 

Leu 

Lys 

Pro 

Arg 

1175 

val 

Glu 

Ala 

Pro 

Lys 

1180 

Gin 

Glu 

Glu 

Pro 

Pro 

1185 

Asn 

Thr 

Glu 

Asp 

Ser 

1190 

Lys 

Thr 

Glu 

Glu 

Lys 

1195 

Ser 

val 

Val 

Gin 

Lys 

1200 

Pro 

Val 

Asp 

Val 

Lys 

1205 

Pro 

Lys 

lie 

Lys 

Ala 

1210 

Cys 

lie 

Asp 

Glu 

Val 

1215 

Thr 

Thr 

Thr 

Leu 

Glu 

1220 

Glu 

Thr 

Lys 

Phe 

Leu 

1225 

Thr 

Asn 

Lys 

Leu 

Leu 

1230 

Leu 

Phe 

Ala 

Asp 

lie 

1235 

Asn 

Gly 

Lys 

Leu 

Tyr 

1240 

His 

Asp 

Ser 

Gin 

Asn 

1245 

Met 

Leu 

Arg 

Gly 

Glu 

1250 

Asp 

Met 

Ser 

Phe 

Leu 

1255 

Glu 

Lys 

Asp 

Ala 

Pro 

1260 

Tyr 

Met val 

Gly 

Asp 

1265 

val 

lie 

Thr 

ser 

Gly 

1270 

Asp 

lie 

Thr 

cys 

val 

1275 

Val 

lie 

Pro 

ser 

Lys 

1280 

Lys 

Ala 

Gly 

Gly 

Thr 

1285 

Thr 

Glu 

Met 

Leu 

Ser 

1290 

Arg 

Ala 

Leu 

Lys 

Lys 

1295 

Val 

Pro 

Val 

Asp 

Glu 

1300 

Tyr 

lie 

Thr 

Thr 

Tyr 

1305 

Pro 

Gly Gin 

Gly 

Cys 

1310 

Ala 

Gly 

Tyr 

Thr 

Leu 

1315 

Glu 

Glu 

Ala 

Lys 

Thr 

1320 

Ala 

Leu 

Lys 

Lys 

cys 

1325 

Lys 

Ser 

Ala 

Phe 

Tyr 

1330 

val 

Leu 

Pro 

ser 

Glu 

1335 

Ala 

Pro 

Asn 

Ala 

Lys 

1340 

Glu 

Glu 

lie 

Leu 

Gly 

1345 

Thr 

val 

Ser 

Trp 

Asn 

1350 

Leu 

Arg 

Glu 

Met 

Leu 

1355 

Ala 

His 

Ala 

Glu 

Glu 

1360 

Thr 

Arg 

Lys 

Leu 

Met 

1365 

Pro 

lie Cys 
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Met 

Asp 

1370 

Val 

Arg 

Ala 

Gly 

lie 

1385 

Lys 

lie 

Gin 

Phe 

Phe 

1400 

Tyr 

Thr 

Ser 

Leu 

Asn 

1415 

ser 

Leu 

Asn 

Val 

Thr 

1430 

His 

Gly 

Phe 

Ser 

Leu 

1445 

Lys 

Ala 

Pro 

Val 

Thr 

1460 

Thr 

Tyr 

Asn 

Glu 

Glu 

1475 

Hi s 

Phe 

val 

ASP 

Trp 

1490 

ser 

Tyr 

Ser 

Leu 

Lys 

1505 

Arg 

Gly 

Asp 

val 

Glu 

1520 

Phe 

Hi s 

Leu 

Lys 

Ser 

1535 

Leu 

Leu 

Ser 

Thr 

Thr 

1550 

val 

Asp 

Asn 

Ser 

Met 

1565 

Thr 

Tyr 

Gly 

Ala 

Asp 

1580 

Val 

Thr 

Lys 

Thr 

Phe 

1595 

Phe 

val 

Leu 

Phe 

Glu 

1610 

Tyr 

Tyr 

Hi s 
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lie 

Met 

1375 

Ala 

Thr 

lie 

Glu 

Gly 

1390 

lie 

Val 

Asp 

Lys 

Glu 

1405 

Pro 

Val 

Ala 

Glu 

Pro 

1420 

Leu 

val 

Thr 

Asn 

Leu 

1435 

Glu 

Glu 

Ala 

Al a 

Val 

1450 

val 

Ser 

val 

Gly 

Tyr 

1465 

Leu 

Thr 

Ser 

Glu 

Thr 

1480 

val 

Ser 

Leu 

Gly 

Gin 

1495 

Arg 

Thr 

Glu 

Lys 

lie 

1510 

Val 

Tyr 

His 

Asp 

Gly 

1525 

Glu 

Val 

Leu 

Leu 

Arg 

1540 

Glu 

Val 

Lys 

Thr 

Asn 

1555 

Leu 

His 

Thr 

Gin 

Gin 

1570 

Phe 

Gly Pro 

lie 

Lys 

1585 

Pro 

Hi s 

val 

pro 

Ser 

1600 

Asp 

Asp 

Thr 

Thr 

Leu 

1615 

Asp 

Glu 

Ser 


Gin 

Arg 

1380 

Lys 

Tyr 

Lys 

Tyr 

Gly 

1395 

Val 

Arg 

Phe 

ser 

lie 

1410 

He 

Thr 

Lys 

Met 

Pro 

1425 

lie 

Gly Tyr 

Ala 

Arg 

1440 

cys 

Met 

Arg 

Ser 

Ser 

1455 

Pro 

Asp Ala 

Ser 

Ser 

1470 

Lys 

Thr 

ser 

Ala 

Gly 

1485 

Ser 

Tyr 

Arg 

Leu 

Gly 

1500 

Val 

Glu 

Phe 

Thr 

Leu 

1515 

Glu 

Ser 

Pro 

Ser 

Leu 

1530 

Asp 

Lys 

Leu 

Thr 

lie 

1545 

Lys 

val 

Phe 

Gin 

Leu 

1560 

val 

Asp 

Met 

Thr 

Tyr 

1575 

Leu 

Asp Gly 

Asn 

Hi s 
1590 

Glu 

Gly 

Lys 

Leu 

Arg 

1605 

Ser 

Glu 

Ala 

Phe 

Leu 

1620 

Gly 

Arg Tyr 
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Met 

Ser 

1625 

Ala 

Leu 

Asn 

Hi s 

Thr 

1630 

Lys 

Lys 

Trp 

Lys 

Phe 

1635 

Pro 

Gin 

val 

Gly 

Gly 

1640 

Leu 

Thr 

Ser 

lie 

Lys 

1645 

Trp 

Ala 

Asp 

Asn 

Asn 

1650 

Cys 

Tyr 

Leu 

Ser 

Ser 

1655 

Val 

Leu 

Leu 

Ala 

Leu 

1660 

Gin 

Gin 

Leu 

Glu 

Val 

1665 

Lys 

Phe 

Asn 

Ala 

Pro 

1670 

Ala 

Leu 

Gin 

Glu 

Ala 

1675 

Tyr 

Tyr 

Arg 

Ala 

Arg 

1680 

Al a 

Gly Asp 

Ala 

Ala 

1685 

Asn 

Phe 

cys 

Ala 

Leu 

1690 

lie 

Leu 

Ala 

Tyr 

ser 

1695 

Asn 

Lys 

Thr 

val 

Gly 

1700 

Glu 

Leu 

Gly 

Asp 

val 

1705 

Arg 

Glu 

Thr 

Met 

Thr 

1710 

His 

Leu 

Leu 

Gin 

Hi s 
1715 
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Asn 

Leu 
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1720 
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Lys 
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Leu 

1725 

Asn 
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Cys 

Lys 

1730 
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cys 

Gly 

Gin 

Lys 

1735 

Thr 

Thr 

Thr 

Leu 
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1740 

Gly 

val 

Glu 
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Tyr 

Met 
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Gly 
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cys 
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cys 
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Lys 
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Gin 
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Cys 
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c_ 

> 

H 
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Gly 
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Lys 

Asp 
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Phe 
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His 
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Val 

Leu 
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Asp 

Thr 
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Gin 

Gly 

Met 

CL 

1/1 

< 

Asn 
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Leu 

Ala 

Cys 

Glu 

ser 

2020 

Gin 

Gin 

Pro 

Thr 

Ser 

2025 

Glu 

Glu 

val 

val 

Glu 

2030 

Asn 

Pro 

Thr 

lie 

Gin 

2035 

Lys 

Glu 

Val 

lie 

Glu 

2040 

Cys 

Asp val 

Lys 

Thr 

2045 

Thr 

Glu 

val 

val 

Gly 

2050 

Asn 

Val 

lie 

Leu 

Lys 

2055 

Pro 

Ser Asp 

Glu 

Gly 

2060 

val 

Lys 

Val 

Thr 

Gin 

2065 

Glu 

Leu Gly 

His 

Glu 

2070 

Asp 

Leu 

Met 

Ala 

Ala 

2075 

Tyr 

Val 

Glu 

Asn 

Thr 

2080 

Ser 

lie 

Thr 

lie 

Lys 

2085 

Lys 

Pro 

Asn 

Glu 

Leu 

2090 

ser 

Leu 

Ala 

Leu 

Gly 

2095 

Leu 

Lys 

Thr 

lie 

Ala 

2100 

Thr 

His 

Gly 

lie 

Al a 
2105 

Ala 

lie 

Asn 

ser 

Val 

2110 

Pro 

Trp 

Ser 

Lys 

lie 

2115 

Leu 

Ala Tyr 

val 

Lys 

2120 

Pro 

Phe 

Leu 

Gly 

Gin 

2125 

Ala 

Ala 

lie 

Thr 

Thr 

2130 

Ser 

Asn 

Cys 
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Ala 

Lys 

2135 

Arg 

Leu 

Ala 

Gin 

Arg 

2140 

Val 

Phe 

Asn 

Asn 

Tyr 

2145 

Met 

Pro 

Tyr 

Val 

Phe 

2150 

Thr 

Leu 

Leu 

Phe 

Gin 

2155 

Leu 

Cys 

Thr 

Phe 

Thr 

2160 

Lys 

ser Thr 

Asn 

Ser 

2165 

Arg 

He 

Arg 

Ala 

Ser 

2170 

Leu 

Pro 

Thr 

Thr 

lie 

2175 

Ala 

Lys 

Asn 

ser 

val 

2180 

Lys 

ser 

val 

Ala 

Lys 

2185 

Leu 

cys 

Leu 

Asp 

Al a 
2190 

Gly 

lie 

Asn 

Tyr 

val 

2195 

Lys 

ser 

pro 

Lys 

Phe 

2200 

Ser 

Lys 

Leu 

Phe 

Thr 

2205 

lie 

Ala 

Met 

Trp 

Leu 

2210 

Leu 

Leu 

Leu 

Ser 

lie 

2215 

cys 

Leu Gly 

Ser 

Leu 

2220 

lie 

Cys 

val 

Thr 

Ala 

2225 

Ala 

Phe 

Gly 

val 

Leu 

2230 

Leu 

Ser 

Asn 

Phe 

Gly 

2235 

Ala 

Pro 

Ser 

Tyr 

Cys 

2240 

Asn 

Gly 

val 

Arg 

Glu 

2245 

Leu 

Tyr 

Leu 

Asn 

Ser 

2250 

Ser 

Asn 

val 

Thr 

Thr 

2255 

Met 

Asp 

Phe 

cys 

Glu 

2260 

Gly 

Ser 

Phe 

Pro 

Cys 

2265 

Ser 

lie 

Cys 

Leu 

Ser 

2270 

Gly 

Leu 

Asp 

Ser 

Leu 

2275 

Asp 

Ser Tyr 

Pro 

Ala 

2280 

Leu 

Glu 

Thr 

lie 

Gin 

2285 

val 

Thr 

lie 

ser 

ser 

2290 

Tyr 

Lys 

Leu 

Asp 

Leu 

2295 

Thr 

He 

Leu 

Gly 

Leu 

2300 

Ala 

Ala 

Glu 

Trp 

Val 

2305 

Leu 

Ala Tyr 

Met 

Leu 

2310 

Phe 

Thr 

Lys 

Phe 

Phe 

2315 

Tyr 

Leu 

Leu 

Gly 

Leu 

2320 

Ser 

Ala 

lie 

Met 

Gin 

2325 

Val 

Phe 

Phe 

Gly 

Tyr 

2330 

Phe 

Ala 

Ser 

His 

Phe 

2335 

lie 

Ser 

Asn 

Ser 

Trp 

2340 

Leu 

Met Trp 

Phe 

lie 

2345 

lie 

ser 

lie 

Val 

Gin 

2350 

Met 

Ala 

Pro 

val 

ser 

2355 

Ala 

Met 

val 

Arg 

Met 

2360 

Tyr 

lie 

Phe 

phe 

Ala 

2365 

Ser 

Phe Tyr 

Tyr 

lie 

2370 

Trp 

Lys 

Ser 

Tyr 

val 

2375 

His 

lie 

Met 

Asp 

Gly 

2380 

cys 

Thr 

Ser 

Ser 

Thr 

2385 

Cys 

Met 

Met 
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Cys 

Tyr 

2390 

Lys 

Arg 

Asn 

Arg 

Ala 

2395 

Thr 

Arg 

Val 

Glu 

Cys 

2400 

Thr 

Thr 

lie 

val 

Asn 

2405 

Gly 

Met 

Lys 

Arg 

Ser 

2410 

Phe 

Tyr val 

Tyr 

Ala 

2415 

Asn 

Gly Gly 

Arg 

Gly 

2420 

Phe 

cys 

Lys 

Thr 

His 

2425 

Asn 

Trp Asn 

Cys 

Leu 

2430 

Asn 

Cys Asp 

Thr 

Phe 

2435 

cys 

Thr 

Gly Ser 

Thr 

2440 

phe 

lie 

Ser 

Asp 

Glu 

2445 

val 

Ala Arg 

Asp 

Leu 

2450 

Ser 

Leu 

Gin 

Phe 

Lys 

2455 

Arg 

Pro 

lie 

Asn 

Pro 

2460 

Thr 

Asp 

Gin 

Ser 

Ser 

2465 

Tyr 

lie 

val 

Asp 

Ser 

2470 

val 

Ala 

val 

Lys 

Asn 

2475 

Gly 

Ala 

Leu 

His 

Leu 

2480 

Tyr 

Phe 

Asp 

Lys 

Ala 

2485 

Gly 

Gin 

Lys 

Thr 

Tyr 

2490 

Glu 

Arg 

His 

Pro 

Leu 

2495 

Ser 

Hi s 

Phe 

val 

Asn 

2500 

Leu 

Asp Asn 

Leu 

Arg 

2505 

Ala 

Asn 

Asn 

Thr 

Lys 

2510 

Gly 

Ser 

Leu 

Pro 

lie 

2515 

Asn 

Val 

lie 

val 

Phe 

2520 

Asp 

Gly Lys 

Ser 

Lys 

2525 

Cys 

Asp 

Glu 

Ser 

Ala 

2530 

Ser 

Lys 

Ser 

Ala 

Ser 

2535 

Val 

Tyr Tyr 

Ser 

Gin 

2540 

Leu 

Met 

cys 

Gin 

Pro 

2545 

lie 

Leu 

Leu 

Leu 

Asp 

2550 

Gin 

Al a 

Leu 

val 

ser 

2555 

Asp 

val 

Gly Asp 

Ser 

2560 

Thr 

Glu 

val 

Ser 

Val 

2565 

Lys 

Met 

Phe 

Asp 

Ala 

2570 

Tyr 

val 

Asp Thr 

Phe 

2575 

Ser 

Ala 

Thr 

Phe 

Ser 

2580 

val 

Pro 

Met 

Glu 

Lys 

2585 

Leu 

Lys 

Ala 

Leu 

Val 

2590 

Ala 

Thr 

Ala 

Hi s 

Ser 

2595 

Glu 

Leu 

Ala 

Lys 

Gly 

2600 

val 

Ala 

Leu 

Asp 

Gly 

2605 

val 

Leu 

ser 

Thr 

Phe 

2610 

val 

Ser 

Ala 

Ala 

Arg 

2615 

Gin 

Gly 

val 

val 

Asp 

2620 

Thr 

Asp 

val 

Asp 

Thr 

2625 

Lys 

Asp 

Val 

lie 

Glu 

2630 

cys 

Leu 

Lys 

Leu 

ser 

2635 

His 

His 

Ser 

ASp 

Leu 

2640 

Glu 

val 

Thr 
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Gly 

Asp 

2645 

Ser 

cys 

Asn 

Asn 

Phe 

2650 

Met 

Leu 

Thr 

Tyr 

Asn 

2655 

Lys 

val 

Glu 

Asn 

Met 

2660 

Thr 

Pro 

Arg 

Asp 

Leu 

2665 

Gly 

Ala 

Cys 

lie 

ASP 

2670 

Cys 

Asn 

Ala 

Arg 

His 

2675 

lie 

Asn 

Ala 

Gin 

val 

2680 

Ala 

Lys 

Ser 

Hi s 

Asn 

2685 

val 

Ser 

Leu 

lie 

Trp 

2690 

Asn 

val 

Lys 

Asp 

Tyr 

2695 

Met 

Ser 

Leu 

ser 

Glu 

2700 

Gin 

Leu 

Arg 

Lys 

Gin 

2705 

lie 

Arg 

Ser 

Ala 

Ala 

2710 

Lys 

Lys 

Asn 

Asn 

lie 

2715 

Pro 

Phe Arg 

Leu 

Thr 

2720 

cys 

Ala 

Thr 

Thr 

Arg 

2725 

Gin 

val 

Val 

Asn 

Val 

2730 

lie 

Thr 

Thr 

Lys 

lie 

2735 

ser 

Leu 

Lys 

Gly 

Gly 

2740 

Lys 

lie 

val 

ser 

Thr 

2745 

cys 

phe 

Lys 

Leu 

Met 

2750 

Leu 

Lys 

Ala 

Thr 

Leu 

2755 

Leu 

cys 

val 

Leu 

Ala 

2760 

Ala 

Leu 

val 

Cys 

Tyr 

2765 

lie 

Val 

Met 

Pro 

val 

2770 

His 

Thr 

Leu 

Ser 

lie 

2775 

Hi s 

Asp Gly 

Tyr 

Thr 

2780 

Asn 

Glu 

lie 

lie 

Gly 

2785 

Tyr 

Lys 

Ala 

lie 

Gin 

2790 

Asp 

Gly Val 

Thr 

Arg 

2795 

Asp 

lie 

lie 

ser 

Thr 

2800 

Asp 

Asp Cys 

Phe 

Ala 

2805 

Asn 

Lys 

His 

Ala 

Gly 

2810 

Phe 

Asp 

Ala 

Trp 

Phe 

2815 

ser 

Gin 

Arg 

Gly 

Gly 

2820 

ser 

Tyr 

Lys 

Asn 

ASP 

2825 

Lys 

Ser 

Cys 

Pro 

val 

2830 

Val 

Ala 

Ala 

lie 

lie 

2835 

Thr 

Arg Glu 

lie 

Gly 

2840 

Phe 

lie 

val 

Pro 

Gly 

2845 

Leu 

Pro Gly 

Thr 

Val 

2850 

Leu 

Arg Ala 

lie 

Asn 

2855 

Gly 

Asp 

Phe 

Leu 

His 

2860 

phe 

Leu 

Pro 

Arg 

val 

2865 

phe 

Ser 

Ala 

val 

Gly 

2870 

Asn 

lie 

cys 

Tyr 

Thr 

2875 

Pro 

Ser 

Lys 

Leu 

lie 

2880 

Glu 

Tyr 

Ser 

Asp 

Phe 

2885 

Ala 

Thr 

Ser 

Ala 

cys 

2890 

val 

Leu 

Ala 

Ala 

Glu 

2895 

Cys 

Thr 

He 
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Phe 

Lys 

2900 

Asp 

Ala 

Met Gly 

Lys 

2905 

Pro 

val 

Pro 

Tyr 

Cys 

2910 

Tyr 

Asp Thr 

Asn 

Leu 

2915 

Leu 

Glu 

Gly ser 

lie 

2920 

Ser Tyr 

Ser 

Glu 

Leu 

2925 

Arg 

Pro 

Asp 

Thr 

Arg 

2930 

Tyr 

val 

Leu 

Met 

Asp 

2935 

Gly ser 

lie 

lie 

Gin 

2940 

Phe 

Pro 

Asn 

Thr 

Tyr 

2945 

Leu 

Glu 

Gly ser 

Val 

2950 

Arg 

val 

val 

Thr 

Thr 

2955 

Phe 

Asp Ala 

Glu 

Tyr 

2960 

cys 

Arg 

Hi s 

Gly Thr 
2965 

cys 

Glu Arg 

Ser 

Glu 

2970 

Val 

Gly lie 

cys 

Leu 

2975 

ser 

Thr 

ser Gly Arg 
2980 

Trp 

val 

Leu 

Asn 

Asn 

2985 

Glu 

Hi s 

Tyr 

Arg 

Ala 

2990 

Leu 

Ser 

Gly val 

Phe 

2995 

cys 

Gly val 

Asp 

Ala 

3000 

Met 

Asn 

Leu 

lie 

Ala 

3005 

Asn 

lie 

phe 

Thr 

Pro 

3010 

Leu 

val 

Gin 

Pro 

Val 

3015 

Gly 

Ala 

Leu 

Asp 

Val 

3020 

Ser 

Ala 

Ser 

Val 

Val 

3025 

Ala 

Gly Gly lie 

lie 

3030 

Ala 

lie 

Leu 

val 

Thr 

3035 

cys 

Ala 

Ala Tyr 

Tyr 

3040 

Phe 

Met 

Lys 

Phe Arg 
3045 

Arg 

val 

Phe 

Gly 

Glu 

3050 

Tyr 

Asn 

His 

Val 

Val 

3055 

Ala 

Ala 

Asn 

Ala 

Leu 

3060 

Leu 

Phe 

Leu 

Met 

Ser 

3065 

Phe 

Thr 

lie 

Leu 

cys 

3070 

Leu 

val 

Pro 

Ala 

Tyr 

3075 

Ser 

phe 

Leu 

Pro 

Gly 

3080 

val 

Tyr 

Ser 

val 

Phe 

3085 

Tyr 

Leu Tyr 

Leu 

Thr 

3090 

Phe Tyr 

Phe 

Thr 

Asn 

3095 

Asp 

val 

Ser 

Phe 

Leu 

3100 

Ala 

His 

Leu 

Gin 

Trp 

3105 

Phe 

Ala 

Met 

Phe 

ser 

3110 

Pro 

lie 

val 

Pro 

Phe 

3115 

Trp 

lie 

Thr 

Ala 

lie 

3120 

Tyr 

val 

Phe 

cys 

lie 

3125 

Ser 

Leu 

Lys 

His 

cys 

3130 

Hi s 

Trp 

Phe 

Phe Asn 
3135 

Asn 

Tyr 

Leu 

Arg 

Lys 

3140 

Arg 

Val 

Met 

Phe 

Asn 

3145 

Gly Val 

Thr 

Phe 

Ser 

3150 

Thr 

Phe 

Glu 
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Glu 

Ala 

3155 

Ala 

Leu 

cys 

Thr 

phe 

3160 

Leu 

Leu 

Asn 

Lys 

Glu 

3165 

Met 

Tyr 

Leu 

Lys 

Leu 

3170 

Arg 

Ser 

Glu 

Thr 

Leu 

3175 

Leu 

Pro 

Leu 

Thr 

Gin 

3180 

Tyr 

Asn 

Arg 

Tyr 

Leu 

3185 

Ala 

Leu 

Tyr 

Asn 

Lys 

3190 

Tyr 

Lys 

Tyr 

Phe 

ser 

3195 

Gly 

Ala 

Leu 

Asp 

Thr 

3200 

Thr 

Ser 

Tyr 

Arg 

Glu 

3205 

Ala 

Ala 

cys 

cys 

His 

3210 

Leu 

Ala 

Lys 

Ala 

Leu 

3215 

Asn 

Asp 

Phe 

ser 

Asn 

3220 

Ser 

Gly 

Ala 

Asp 

val 

3225 

Leu 

Tyr 

Gin 

Pro 

Pro 

3230 

Gin 

Thr 

Ser 

lie 

Thr 

3235 

ser 

Ala 

Val 

Leu 

Gin 

3240 

Ser 

Gly 

Phe 

Arg 

Lys 

3245 

Met 

Ala 

Phe 

Pro 

ser 

3250 

Gly 

Lys 

val 

Glu 

Gly 

3255 

Cys 

Met 

val 

Gin 

val 

3260 

Thr 

cys 

Gly 

Thr 

Thr 

3265 

Thr 

Leu 

Asn 

Gly 

Leu 

3270 

Trp 

Leu 

Asp 

Asp 

Thr 

3275 

Val 

Tyr 

Cys 

Pro 

Arg 

3280 

His 

val 

lie 

Cys 

Thr 

3285 

Ala 

Glu 

Asp 

Met 

Leu 

3290 

Asn 

Pro 

Asn 

Tyr 

Glu 

3295 

Asp 

Leu 

Leu 

lie 

Arg 

3300 

Lys 

Ser 

Asn 

His 

ser 

3305 

Phe 

Leu 

val 

Gin 

Ala 

3310 

Gly 

Asn 

val 

Gin 

Leu 

3315 

Arg 

val 

lie 

Gly 

His 

3320 

Ser 

Met 

Gin 

Asn 

Cys 

3325 

Leu 

Leu 

Arg 

Leu 

Lys 

3330 

Val 

Asp 

Thr 

ser 

Asn 

3335 

Pro 

Lys 

Thr 

Pro 

Lys 

3340 

Tyr 

Lys 

Phe 

Val 

Arg 

3345 

lie 

Gin 

Pro 

Gly 

Gin 

3350 

Thr 

Phe 

Ser 

Val 

Leu 

3355 

Ala 

cys 

Tyr 

Asn 

Gly 

3360 

Ser 

Pro 

Ser 

Gly 

val 

3365 

Tyr 

Gl n 

cys 

Ala 

Met 

3370 

Arg 

Pro 

Asn 

Hi s 

Thr 

3375 

lie 

Lys Gly 

ser 

Phe 

3380 

Leu 

Asn 

Gly 

ser 

Cys 

3385 

Gly 

Ser 

val 

Gly 

Phe 

3390 

Asn 

lie 

Asp 

Tyr 

Asp 

3395 

Cys 

Val 

Ser 

Phe 

cys 

3400 

Tyr 

Met 

Hi s 

His 

Met 

3405 

Glu 

Leu 

Pro 
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Gly 

3410 

val 

Pro 

Phe 

3425 

val 

Thr 

lie 

3440 

Thr 

Asn 

Gly 

3455 

Asp 

Asp 

Phe 

3470 

Asn 

Gin 

Asp 

3485 

Hi s 

lie 

Ala 

3500 

val 

Asn 

Gly 

3515 

Met 

Asp 

Glu 

3530 

Phe 

Thr 

Phe 

3545 

Gin 

Trp 

Met 

3560 

Leu 

Ser 

Thr 

3575 

Gin 

Leu 

Pro 

3590 

Phe 

Leu 

Leu 

3605 

val 

Pro 

Ser 

3620 

Leu 

Ala 

Ser 

3635 

Trp 

Thr 

Ser 

3650 

Leu 


Hi s 

Ala 

Gly 

Asp 

Arg 

Gin 

Leu 

Asn 

Val 

Arg 

Trp 

Phe 

Leu 

Val 

Ala 

val 

Asp 

lie 

Leu 

Asp 

Met 

Asn 

Gly 

Arg 

Thr 

Pro 

Phe 

Gly 

Lys 

Phe 

Leu 

Thr 

Phe 

Trp 

Ser 

Leu 

Thr 

Leu 

Gly 

Lys 

His 

Lys 

Ala 

Thr 

val 

Val 

Met 

Arg 

ser 
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Thr 

3415 

Asp 

Leu 

Thr 

3430 

Ala 

Gin 

Leu 

3445 

Ala 

Trp 

Leu 

3460 

Asn 

Arg 

Met 

3475 

Lys 

Tyr 

Leu 

3490 

Gly 

Pro 

Cys 

3505 

Ala 

Ala 

Thr 

3520 

lie 

Leu 

Asp 

3535 

Val 

val 

Lys 

3550 

Lys 

lie 

Leu 

3565 

Thr 

ser 

Phe 

3580 

Phe 

Phe 

lie 

3595 

Met 

Ala 

Hi s 
3610 

Ala 

Phe 

Ala 

3625 

Tyr 

Phe 

lie 

3640 

Met 

Thr 

Arg 

3655 

Leu 

Lys 


Glu 

Gly 

Lys 

3420 

Ala 

Ala 

Gly 

3435 

Leu 

Tyr 

Ala 

3450 

Phe 

Thr 

Thr 

3465 

Asn 

Tyr 

Glu 

3480 

Leu 

ser 

Ala 

3495 

Leu 

Lys 

Glu 

3510 

Gly 

Ser 

Thr 

3525 

Arg 

Gin 

Cys 

3540 

val 

Lys 

Gly 

3555 

Leu 

Leu 

lie 

3570 

val 

Tyr 

Glu 

3585 

lie 

Ala 

Ala 

3600 

Leu 

Cys 

Leu 

3615 

Asn 

Met 

val 

3630 

Trp 

Leu 

Glu 

3645 

Asp 

Cys 

Val 

3660 


Phe 

Tyr 

Gly 

Thr 

Asp 

Thr 

Ala 

Val 

lie 

Thr 

Leu 

Asn 

Pro 

Leu 

Thr 

Gin 

Thr 

Gly 

Leu 

Leu 

Gin 

lie 

Leu 

Glu 

Ser 

Gly 

val 

Thr 

His 

His 

Leu 

val 

Gin 

Asn 

Ala 

Phe 

Cys 

Ala 

Met 

Phe 

Leu 

Leu 

Tyr 

Met 

Pro 

Leu 

Ala 

Asp 

Met 

Tyr 

Ala 
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Ser 

Ala 

3665 

Leu 

Val 

Leu 

Leu 

lie 

3670 

Leu 

Met 

Thr 

Ala 

Arg 

3675 

Thr 

val 

Tyr 

Asp 

ASp 

3680 

Ala 

Ala 

Arg 

Arg 

val 

3685 

Trp 

Thr 

Leu 

Met 

Asn 

3690 

Val 

lie 

Thr 

Leu 

val 

3695 

Tyr 

Lys 

Val 

Tyr 

Tyr 

3700 

Gly 

Asn 

Ala 

Leu 

ASp 

3705 

Gin 

Ala 

lie 

Ser 

Met 

3710 

Trp 

Ala 

Leu 

val 

lie 

3715 

Ser 

val 

Thr 

ser 

Asn 

3720 

Tyr 

Ser Gly 

val 

Val 

3725 

Thr 

Thr 

lie 

Met 

Phe 

3730 

Leu 

Ala 

Arg 

Ala 

lie 

3735 

val 

Phe 

Val 

cys 

val 

3740 

Glu 

Tyr 

Tyr 

Pro 

Leu 

3745 

Leu 

Phe 

lie 

Thr 

Gly 

3750 

Asn 

Thr 

Leu 

Gin 

Cys 

3755 

lie 

Met 

Leu 

val 

Tyr 

3760 

cys 

Phe 

Leu 

Gly 

Tyr 

3765 

cys 

Cys 

Cys 

cys 

Tyr 

3770 

Phe 

Gly 

Leu 

Phe 

cys 

3775 

Leu 

Leu 

Asn 

Arg 

Tyr 

3780 

Phe 

Arg 

Leu 

Thr 

Leu 

3785 

Gly 

Val 

Tyr 

Asp 

Tyr 

3790 

Leu 

val 

Ser 

Thr 

Gin 

3795 

Glu 

Phe 

Arg 

Tyr 

Met 

3800 

Asn 

Ser 

Gin 

Gly 

Leu 

3805 

Leu 

Pro 

Pro 

Lys 

Ser 

3810 

Ser 

lie 

Asp 

Ala 

Phe 

3815 

Lys 

Leu 

Asn 

lie 

Lys 

3820 

Leu 

Leu 

Gly 

lie 

Gly 

3825 

Gly 

Lys 

pro 

Cys 

lie 

3830 

Lys 

val 

Ala 

Thr 

Val 

3835 

Gin 

Ser 

Lys 

Met 

Ser 

3840 

Asp 

val 

Lys 

cys 

Thr 

3845 

Ser 

Val 

Val 

Leu 

Leu 

3850 

Ser 

Val 

Leu 

Gin 

Gin 

3855 

Leu 

Arg 

val 

Glu 

Ser 

3860 

ser 

Ser 

Lys 

Leu 

Trp 

3865 

Ala 

Gin 

Cys 

Val 

Gin 

3870 

Leu 

Hi s 

Asn 

Asp 

lie 

3875 

Leu 

Leu 

Ala 

Lys 

Asp 

3880 

Thr 

Thr 

Glu 

Ala 

Phe 

3885 

Glu 

Lys 

Met 

val 

ser 

3890 

Leu 

Leu 

Ser 

val 

Leu 

3895 

Leu 

ser 

Met 

Gin 

Gly 

3900 

Ala 

val 

Asp 

lie 

Asn 

3905 

Arg 

Leu 

Cys 

Glu 

Glu 

3910 

Met 

Leu 

Asp 

Asn 

Arg 

3915 

Ala 

Thr 

Leu 
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Gin 

Ala 

3920 

lie 

Ala 

ser 

Glu 

Phe 

3925 

Ser 

Ser 

Leu 

Pro 

ser 

3930 

Tyr 

Ala 

Ala 

Tyr 

Ala 

3935 

Thr 

Ala 

Gin 

Glu 

Ala 

3940 

Tyr 

Glu 

Gin 

Ala 

Val 

3945 

Ala 

Asn Gly 

Asp 

Ser 

3950 

Glu 

Val 

Val 

Leu 

Lys 

3955 

Lys 

Leu 

Lys 

Lys 

ser 

3960 

Leu 

Asn 

val 

Ala 

Lys 

3965 

ser 

Glu 

Phe 

Asp 

Arg 

3970 

Asp 

Al a 

Ala 

Met 

Gin 

3975 

Arg 

Lys 

Leu 

Glu 

Lys 

3980 

Met 

Ala 

Asp 

Gin 

Ala 

3985 

Met 

Thr 

Gin 

Met 

Tyr 

3990 

Lys 

Gin 

Ala 

Arg 

Ser 

3995 

Glu 

Asp 

Lys 

Arg 

Al a 
4000 

Lys 

Val 

Thr 

Ser 

Ala 

4005 

Met 

Gin 

Thr 

Met 

Leu 

4010 

Phe 

Thr 

Met 

Leu 

Arg 

4015 

Lys 

Leu 

Asp 

Asn 

Asp 

4020 

Ala 

Leu 

Asn 

Asn 

lie 

4025 

lie 

Asn 

Asn 

Ala 

Arg 

4030 

Asp 

Gly Cys Val 

pro 

4035 

Leu 

Asn 

lie 

lie 

Pro 

4040 

Leu 

Thr 

Thr 

Ala 

Ala 

4045 

Lys 

Leu 

Met 

Val 

val 

4050 

Val 

Pro Asp 

Tyr 

Gly 

4055 

Thr 

Tyr 

Lys 

Asn 

Thr 

4060 

Cys 

Asp Gly Asn 

Thr 

4065 

Phe 

Thr Tyr 

Ala 

Ser 

4070 

Ala 

Leu 

Trp 

Glu 

lie 

4075 

Gin 

Gin 

Val 

val 

Asp 

4080 

Ala 

Asp 

Ser 

Lys 

lie 

4085 

val 

Gl n 

Leu 

ser 

Glu 

4090 

lie 

Asn 

Met 

Asp 

Asn 

4095 

Ser 

Pro 

Asn 

Leu 

Ala 

4100 

Trp 

Pro 

Leu 

lie 

val 

4105 

Thr 

Ala 

Leu 

Arg 

Ala 

4110 

Asn 

Ser 

Ala 

val 

Lys 

4115 

Leu 

Gin 

Asn 

Asn 

Glu 

4120 

Leu 

Ser 

Pro 

Val 

Ala 

4125 

Leu 

Arg 

Gin 

Met 

Ser 

4130 

cys 

Al a 

Ala 

Gly 

Thr 

4135 

Thr 

Gin 

Thr 

Ala 

Cys 

4140 

Thr 

Asp 

Asp 

Asn 

Ala 

4145 

Leu 

Al a 

Tyr 

Tyr 

Asn 

4150 

Asn 

Ser 

Lys Gly 

Gly 

4155 

Arg 

Phe 

val 

Leu 

Ala 

4160 

Leu 

Leu 

Ser 

Asp 

Hi s 
4165 

Gin 

Asp 

Leu 

Lys 

Trp 

4170 

Ala 

Arg 

Phe 
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Pro 

Lys 

4175 

Ser 

Asp 

Gly 

Thr 

Gly 

4180 

Thr 

lie 

Tyr 

Thr 

Glu 

4185 

Leu 

Glu 

Pro 

Pro 

cys 

4190 

Arg 

Phe 

Val 

Thr 

Asp 

4195 

Thr 

Pro 

Lys 

Gly 

Pro 

4200 

Lys 

Val 

Lys 

Tyr 

Leu 

4205 

Tyr 

Phe 

lie 

Lys 

Gly 

4210 

Leu 

Asn 

Asn 

Leu 

Asn 

4215 

Arg 

Gly Met 

Val 

Leu 

4220 

Gly 

ser 

Leu 

Ala 

Ala 

4225 

Thr 

Val 

Arg 

Leu 

Gin 

4230 

Ala 

Gly Asn 

Ala 

Thr 

4235 

Glu 

Val 

Pro 

Ala 

Asn 

4240 

Ser 

Thr 

val 

Leu 

Ser 

4245 

Phe 

Cys 

Ala 

Phe 

Ala 

4250 

Val 

Asp 

Pro 

Ala 

Lys 

4255 

Ala 

Tyr 

Lys 

Asp 

Tyr 

4260 

Leu 

Ala 

Ser 

Gly 

Gly 

4265 

Gin 

Pro 

lie 

Thr 

Asn 

4270 

Cys 

Val 

Lys 

Met 

Leu 

4275 

Cys 

Thr 

His 

Thr 

Gly 

4280 

Thr 

Gly 

Gin 

Ala 

lie 

4285 

Thr 

val 

Thr 

Pro 

Glu 

4290 

Ala 

Asn 

Met 

Asp 

Gin 

4295 

Glu 

Ser 

Phe 

Gly 

Gly 

4300 

Ala 

ser 

cys 

cys 

Leu 

4305 

Tyr 

Cys 

Arg 

cys 

His 

4310 

lie 

Asp 

His 

Pro 

Asn 

4315 

Pro 

Lys 

Gly 

Phe 

Cys 

4320 

Asp 

Leu 

Lys 

Gly 

Lys 

4325 

Tyr 

Val 

Gin 

lie 

Pro 

4330 

Thr 

Thr 

Cys 

Ala 

Asn 

4335 

Asp 

Pro 

val 

Gly 

Phe 

4340 

Thr 

Leu 

Arg 

Asn 

Thr 

4345 

Val 

Cys 

Thr 

val 

Cys 

4350 

Gly 

Met 

Trp 

Lys 

Gly 

4355 

Tyr 

Gly 

cys 

ser 

Cys 

4360 

Asp 

Gin 

Leu 

Arg 

Glu 

4365 

Pro 

Leu 

Met 

Gin 

Ser 

4370 

Ala 

Asp 

Ala 

ser 

Thr 

4375 

Phe 

Leu 

Asn 

Gly 

Phe 

4380 

Ala 

Val 
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Arg 

val 

Cys 

Gly 

val 

Ser 

Ala 

Ala 

Arg 

Leu 

Thr 

pro 

cys 

Gly 

Thr 

Gly 

1 




5 





10 





15 

Thr 

Ser 

Thr 

Asp 

val 

val 

Tyr 

Arg 

Ala 

Phe 

Asp 

lie 

Tyr 

Asn 

Glu 

Lys 




20 




25 




30 


val 

Ala 

Gly 

Phe 

Ala 

Lys 

Phe 

Leu 

Lys 

Thr 

Asn 

cys 

cys 

Arg 

Phe 

Gin 



35 




40 



45 



Glu 

Lys 

Asp 

Glu 

Glu 

Gly 

Asn 

Leu 

Leu 

Asp 

ser 

Tyr 

Phe 

val 

Val 

Lys 


50 





55 




60 





Arg 

His 

Thr 

Met 

Ser 

Asn 

Tyr 

Gin 

Hi s 

Glu 

Glu 

Thr 

lie 

Tyr 

Asn 

Leu 

65 





70 




75 




80 

val 

Lys 

Asp 

Cys 

Pro 

Ala 

val 

Ala 

val 

His 

Asp 

Phe 

Phe 

Lys 

Phe 

Arg 





85 





90 




95 

val 

Asp 

Gly 

Asp 

Met 

val 

pro 

His 

lie 

ser 

Arg 

Gin 

Arg 

Leu 

Thr 

Lys 




100 





105 





110 



Tyr 

Thr 

Met 

Ala 

Asp 

Leu 

Val 

Tyr 

Ala 

Leu 

Arg 

His 

Phe 

Asp 

Glu 

Gly 


115 




120 




125 


Asn 

cys 

Asp 

Thr 

Leu 

Lys 

Glu 

lie 

Leu 

Val 

Thr 

Tyr 

Asn 

cys 

Cys 

Asp 


130 



135 





140 


Asp 

Asp 

Tyr 

Phe 

Asn 

Lys 

Lys 

Asp 

Trp 

Tyr 

Asp 

Phe 

val 

Glu 

Asn 

Pro 

145 





150 




155 





160 

Asp 

He 

Leu 

Arg 

val 

Tyr 

Ala 

Asn 

Leu 

Gly 

Glu 

Arg 

val 

Arg 

Gin 

ser 




165 





170 



175 


Leu 

Leu 

Lys 

Thr 

Val 

Gin 

Phe 

Cys 

Asp 

Ala 

Met 

Arg 

Asp 

Ala 

Gly 

lie 



180 





185 




190 



val 

Gly 

Val 

Leu 

Thr 

Leu 

Asp 

Asn 

Gin 

Asp 

Leu 

Asn 

Gly 

Asn 

Trp 

Tyr 



195 




200 





205 



Asp 

Phe 

Gly 

Asp 

Phe 

val 

Gin 

val 

Ala 

Pro 

Gly 

cys 

Gly 

Val 

Pro 

lie 


210 



215 




220 




val 

Asp 

Ser 

Tyr 

Tyr 

Ser 

Leu 

Leu 

Met 

Pro 

lie 

Leu 

Thr 

Leu 

Thr 

Arg 

225 


230 





235 





240 

Ala 

Leu 

Ala 

Ala 

Glu 

Ser 

Hi s 

Met 

Asp 

Ala 

Asp 

Leu 

Ala 

Lys 

Pro 

Leu 





245 




250 



255 


lie 

Lys 

Trp 

Asp 

Leu 

Leu 

Lys 

Tyr 

Asp 

phe 

Thr 

Glu 

Glu 

Arg 

Leu 

Cys 




260 





265 





270 
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Leu 

Phe 

Asp 

Arg 

Tyr 

Phe 

Lys 

Tyr 

Trp 

Asp 

Gl n 

Thr 

Tyr 

His 

Pro 

Asn 



275 





280 



285 




cys 

lie 

Asn 

Cys 

Leu 

Asp 

Asp 

Arg 

cys 

lie 

Leu 

His 

cys 

Ala 

Asn 

Phe 

290 





295 



300 




Asn 

Val 

Leu 

Phe 

ser 

Thr 

val 

Phe 

Pro 

Pro 

Thr 

Ser 

Phe 

Gly 

Pro 

Leu 

305 





310 





315 




320 

val 

Arg 

Lys 

lie 

Phe 

val 

Asp 

Gly 

val 

Pro 

Phe 

val 

val 

Ser 

Thr 

Gly 





325 




330 





335 

Tyr 

Hi s 

Phe 

Arg 

Glu 

Leu 

Gly 

val 

Val 

His 

Asn 

Gin 

Asp 

val 

Asn 

Leu 



340 




345 




350 



His 

Ser 

Ser 

Arg 

Leu 

Ser 

Phe 

Lys 

Glu 

Leu 

Leu 

val 

Tyr 

Al a 

Ala 

Asp 



355 




360 





365 



Pro 

Ala 

Met 

His 

Ala 

Ala 

Ser 

Gly 

Asn 

Leu 

Leu 

Leu 

Asp 

Lys 

Arg 

Thr 


370 





375 




380 


Thr 

cys 

Phe 

Ser 

val 

Ala 

Ala 

Leu 

Thr 

Asn 

Asn 

Val 

Ala 

Phe 

Gin 

Thr 

385 




390 





395 





400 

Val 

Lys 

Pro 

Gly 

Asn 

Phe 

Asn 

Lys 

Asp 

Phe 

Tyr 

Asp 

Phe 

Ala 

val 

ser 



405 



410 



415 


Lys 

Gly 

Phe 

Phe 

Lys 

Glu 

Gly 

Ser 

Ser 

val 

Glu 

Leu 

Lys 

Hi s 

Phe 

Phe 


420 



425 




430 



Phe 

Ala 

Gin 

Asp 

Gly 

Asn 

Ala 

Ala 

lie 

Ser 

Asp 

Tyr 

Asp 

Tyr 

Tyr 

Arg 



435 





440 





445 




Tyr 

Asn 

Leu 

Pro 

Thr 

Met 

Cys 

Asp 

lie 

Arg 

Gin 

Leu 

Leu 

Phe 

Val 

Val 

450 





455 



460 





Glu 

Val 

val 

Asp 

Lys 

Tyr 

Phe 

ASP 

Cys 

Tyr 

Asp 

Gly 

Gly 

Cys 

lie 

Asn 

465 




470 



475 


480 

Ala 

Asn 

Gin 

val 

lie 

Val 

Asn 

Asn 

Leu 

Asp 

Lys 

Ser 

Ala 

Gly 

Phe 

Pro 





485 





490 




495 


Phe 

Asn 

Lys 

Trp 

Gly 

Lys 

Ala 

Arg 

Leu 

Tyr 

Tyr 

Asp 

ser 

Met 

ser 

Tyr 




500 




505 



510 



Glu 

Asp 

Gin 

Asp 

Al a 

Leu 

Phe 

Ala 

Tyr 

Thr 

Lys 

Arg 

Asn 

Val 

lie 

Pro 



515 




520 


525 




Thr 

lie 

Thr 

Gin 

Met 

Asn 

Leu 

Lys 

Tyr 

Ala 

lie 

Ser 

Al a 

Lys 

Asn 

Arg 


530 





535 



540 
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Ala 

Arg 

Thr 

Val 

Ala 

Gly 

val 

Ser 

lie 

cys 

Ser 

Thr 

Met 

Thr 

Asn 

Arg 

545 





550 




555 





560 

Gin 

Phe 

Hi s 

Gin 

Lys 

Leu 

Leu 

Lys 

Ser 

lie 

Ala 

Ala 

Thr 

Arg 

Gly 

Ala 





565 




570 




575 


Thr 

val 

val 

lie 

Gly 

Thr 

ser 

Lys 

Phe 

Tyr 

Gly 

Gly 

Trp 

His 

Asn 

Met 




580 





585 

590 



Leu 

Lys 

Thr 

Val 

Tyr 

ser 

Asp 

val 

Glu 

Thr 

Pro 

Hi s 

Leu 

Met 

Gly 

Trp 



595 




600 





605 


Asp 

Tyr 

Pro 

Lys 

cys 

Asp 

Arg 

Ala 

Met 

Pro 

Asn 

Met 

Leu 

Arg 

lie 

Met 


610 





615 





620 




Ala 

Ser 

Leu 

val 

Leu 

Ala 

Arg 

Lys 

His 

Asn 

Thr 

Cys 

Cys 

Asn 

Leu 

Ser 

625 





630 



635 



640 

His 

Arg 

Phe 

Tyr 

Arg 

Leu 

Ala 

Asn 

Glu 

Cys 

Ala 

Gin 

Val 

Leu 

Ser 

Glu 





645 





650 





655 


Met 

val 

Met 

Cys 

Gly 

Gly 

Ser 

Leu 

Tyr 

val 

Lys 

Pro 

Gly 

Gly 

Thr 

ser 




660 





665 



670 



Ser 

Gly 

Asp 

Ala 

Thr 

Thr 

Ala 

Tyr 

Ala 

Asn 

ser 

val 

Phe 

Asn 

lie 

cys 



675 





680 





685 



Gin 

Ala 

val 

Thr 

Ala 

Asn 

val 

Asn 

Ala 

Leu 

Leu 

Ser 

Thr 

Asp 

Gly 

Asn 


690 





695 





700 



Lys 

lie 

Ala 

Asp 

Lys 

Tyr 

val 

Arg 

Asn 

Leu 

Gin 

Hi s 

Arg 

Leu 

Tyr 

Glu 

705 





710 




715 



720 

Cys 

Leu 

Tyr 

Arg 

Asn 

Arg 

Asp 

Val 

Asp 

His 

Glu 

Phe 

Val 

Asp 

Glu 

Phe 





725 




730 




735 


Tyr 

Ala 

Tyr 

Leu 

Arg 

Lys 

His 

Phe 

ser 

Met 

Met 

lie 

Leu 

Ser 

Asp 

Asp 




740 



745 





750 

Ala 

Val 

val 

Cys 

Tyr 

Asn 

Ser 

Asn 

Tyr 

Ala 

Ala 

Gin 

Gly 

Leu 

val 

Ala 



755 



760 




7 65 




ser 

lie 

Lys 

Asn 

Phe 

Lys 

Ala 

val 

Leu 

Tyr 

Tyr 

Gin 

Asn 

Asn 

val 

Phe 


770 




775 



780 





Met 

Ser 

Glu 

Ala 

Lys 

cys 

Trp 

Thr 

Glu 

Thr 

Asp 

Leu 

Thr 

Lys 

Gly 

Pro 

785 





790 





795 



800 

Hi s 

Glu 

Phe 

cys 

ser 

Gin 

Hi s 

Thr 

Met 

Leu 

Val 

Lys 

Gin 

Gly 

Asp 

Asp 





805 





810 





815 
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Tyr Val Tyr Leu Pro Tyr Pro Asp Pro ser Arg He Leu Gly Ala Gly 
820 825 830 


Cys Phe Val Asp Asp lie Val Lys Thr Asp Gly Thr Leu Met lie Glu 
835 840 845 


Arg Phe Val Ser Leu Ala lie Asp Ala Tyr Pro Leu Thr Lys His Pro 
850 855 860 


Asn Gin Glu Tyr Ala Asp Val Phe His Leu Tyr Leu Gin Tyr lie Arg 
865 870 875 880 


Lys Leu His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr ser Val 
885 890 895 


Met Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr 
900 905 910 


Glu Ala Met Tyr Thr Pro His Thr val Leu Gin Ala Val Gly Ala cys 
915 920 925 


Val Leu Cys Asn ser Gin Thr Ser Leu Arg Cys Gly Ala Cys lie Arg 
930 935 940 


Arg Pro Phe Leu cys cys Lys cys cys Tyr Asp His val lie ser Thr 
945 950 955 960 


Ser His Lys Leu val Leu Ser val Asn Pro Tyr Val cys Asn Ala pro 
965 970 975 


Gly Cys Asp Val Thr Asp Val Thr Gin Leu Tyr Leu Gly Gly Met Ser 
980 985 990 


Tyr Tyr Cys Lys Ser His Lys Pro Pro lie Ser Phe Pro Leu Cys Ala 
995 1000 1005 


Asn Gly Gin val Phe Gly Leu Tyr Lys Asn Thr cys val Gly Ser 
1010 1015 1020 


Asp Asn val Thr Asp phe Asn Ala lie Ala Thr Cys Asp Trp Thr 
1025 1030 1035 


Asn Ala Gly Asp Tyr lie Leu Ala Asn Thr cys Thr Glu Arg Leu 
1040- 1045 1050 


Lys Leu Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe 
1055 1060 1065 


Lys Leu Ser Tyr Gly lie Ala Thr Val Arg Glu val Leu ser Asp 
1070 1075 1080 
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Arq Glu Leu His Leu Ser Trp Glu val Gly Lys Pro Arg Pro pro 
1085 1090 1095 


Leu Asn Arg Asn Tyr val Phe Thr Gly Tyr Arg val Thr Lys Asn 
1100 1105 1110 


Ser Lys Val Gin lie Gly Glu Tyr Thr Phe Glu Lys Gly Asp Tyr 
1115 1120 1125 


Gly Asp Ala Val Val Tyr Arg Gly Thr Thr Thr Tyr Lys Leu Asn 
1130 1135 1140 


val Gly Asp Tyr Phe val Leu Thr Ser His Thr Val Met Pro Leu 
1145 1150 1155 


Ser Ala Pro Thr Leu Val Pro Gin Glu His Tyr Val Arg lie Thr 
1160 1165 1170 


Gly Leu Tyr Pro Thr Leu Asn lie ser Asp Glu Phe ser Ser Asn 
1175 1180 1185 


val Ala Asn Tyr Gin Lys val Gly Met Gin Lys Tyr Ser Thr Leu 
1190 1195 1200 


Gin Gly Pro Pro Gly Thr Gly Lys Ser His Phe Ala lie Gly Leu 
1205 1210 1215 


Ala Leu Tyr Tyr Pro Ser Ala Arg lie Val Tyr Thr Ala Cys Ser 
1220 1225 1230 


His Ala Ala val Asp Ala Leu Cys Glu Lys Ala Leu Lys Tyr Leu 
1235 1240 1245 


Pro lie Asp Lys Cys Ser Arg lie lie Pro Ala Arg Ala Arg Val 
1250 1255 1260 


Glu cys Phe Asp Lys Phe Lys val Asn ser Thr Leu Glu Gin Tyr 
1265 1270 1275 


Val Phe Cys Thr val Asn Ala Leu Pro Glu Thr Thr Ala Asp lie 
1280 1285 1290 


Val val Phe Asp Glu lie ser Met Ala Thr Asn Tyr Asp Leu Ser 
1295 1300 1305 


Val val Asn Ala Arg Leu Arg Ala Lys His Tyr Val Tyr lie Gly 
1310 1315 1320 


Asp pro Ala Gin Leu Pro Ala Pro Arg Thr Leu Leu Thr Lys Gly 
1325 1330 1335 
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Thr Leu Glu Pro Glu Tyr Phe 
1B40 1345 


Thr lie Gly Pro Asp Met Phe 
1355 1360 


Ala Glu lie Val Asp Thr val 
1370 1375 


Leu Lys Ala His Lys Asp Lys 
1385 1390 


Tyr Lys Gly Val lie Thr His 
1400 1405 


Pro Gin lie Gly Val val Arg 
1415 1420 


Trp Arg Lys Ala val Phe lie 
1430 1435 


val Ala ser Lys lie Leu Gly 
1445 1450 


Ser Gin Gly ser Glu Tyr Asp 
1460 1465 


Glu Thr Ala His Ser cys Asn 
1475 1480 


Thr Arg Ala Lys lie Gly lie 
1490 1495 


Asn val Ala Thr Leu Gin Ala 
1520 1525 


Asp cys Ser Lys lie lie Thr 
1535 1540 


Thr His Leu Ser val Asp lie 
1550 1555 


Val Asp lie Pro Gly lie Pro 
1565 1570 


lie ser Met Met Gly Phe Lys 
1580 1585 


Asn Ser val Cys Arg Leu Met Lys 
1350 

Leu Gly Thr cys Arg Arg Cys Pro 
1365 

Ser Ala Leu val Tyr Asp Asn Lys 
1380 

Ser Ala Gin cys Phe Lys Met Phe 
1395 

Asp val ser ser Ala lie Asn Arg 
1410 

Glu Phe Leu Thr Arg Asn Pro Ala 

1425 

Ser Pro Tyr Asn Ser Gin Asn Ala 

1440 

Leu Pro Thr Gin Thr Val Asp Ser 

1455 

Gin Thr Thr 

Val Ala lie 

Asp Arg Asp 

Pro Arg Arg 

Leu Phe Lys 

Gin Ala Pro 

Lys Phe Lys Thr Glu Gly Leu Cys 

1560 

Lys Asp Met Thr Tyr Arg Arg Leu 

1575 

Met Asn Tyr Gin val Asn Gly Tyr 

1590 


Tyr Val lie Phe Thr 
1470 


Val Asn Arg Phe Asn 
1485 


Leu cys lie Met Ser 
1500 


Leu Tyr Asp Lys Leu Gin Phe Thr Ser Leu Glu lie 
1505 1510 1515 


Glu Asn Val Thr Gly 
1530 


Gly Leu His Pro Thr 
1545 


176 


5 

10 

15 

20 

25 

30 

35 

40 

45 

50 

55 


EP 1 694 829 B1 


Pro 

Asn 

1595 

Met 

Phe 

He 

Thr 

Arg 

1600 

Glu 

Glu 

Ala 

lie 

Arg 

1605 

Hi s 

Val 

Arg 

Ala 

Trp 

1610 

lie Gly 

Phe 

Asp 

val 

1615 

Glu 

Gly 

cys 

His 

Ala 

1620 

Thr 

Arg 

Asp 

Ala 

Val 

1625 

Gly Thr 

Asn 

Leu 

Pro 

1630 

Leu 

Gin 

Leu 

Gly 

Phe 

1635 

Ser 

Thr Gly 

val 

Asn 

1640 

Leu 

val 

Ala 

val 

pro 

1645 

Thr 

Gly 

Tyr 

val 

Asp 

1650 

Thr 

Glu 

Asn 

Asn 

Thr 

1655 

Glu 

Phe 

Thr 

Arg 

Val 

1660 

Asn 

Ala 

Lys 

Pro 

Pro 

1665 

pro 

Gly Asp 

Gin 

Phe 

1670 

Lys 

Hi s 

Leu 

lie 

Pro 

1675 

Leu 

Met 

Tyr 

Lys 

Gly 

1680 

Leu 

pro Trp 

Asn 

Val 

1685 

val 

Arg 

lie 

Lys 

lie 

1690 

Val 

Gin 

Met 

Leu 

Ser 

1695 

Asp 

Thr 

Leu 

Lys 

Gly 

1700 

Leu 

Ser 

Asp 

Arg 

Val 

1705 

val 

Phe 

val 

Leu 

Trp 

1710 

Ala 

His 

Gly 

Phe 

Glu 

1715 

Leu 

Thr 

Ser 

Met 

Lys 

1720 

Tyr 

Phe 

val 

Lys 

He 

1725 

Gly 

Pro 

Glu 

Arg 

Thr 

1730 

cys 

Cys 

Leu 

cys 

Asp 

1735 

Lys 

Arg 

Ala 

Thr 

Cys 

1740 

Phe 

Ser 

Thr 

ser 

Ser 

1745 

Asp Thr 

Tyr 

Ala 

Cys 

1750 

Trp 

Asn 

His 

Ser 

Val 

1755 

Gly 

Phe Asp 

Tyr 

val 

1760 

Tyr Asn 

Pro 

Phe 

Met 

1765 

lie 

Asp 

val 

Gin 

Gin 

1770 

Trp 

Gly Phe 

Thr 

Gly 

1775 

Asn 

Leu 

Gin 

Ser 

Asn 

1780 

Hi s 

Asp 

Gin 

His 

Cys 

1785 

Gin 

Val 

His 

Gly 

Asn 

1790 

Ala 

His 

val 

Ala 

Ser 

1795 

Cys 

Asp 

Ala 

lie 

Met 

1800 

Thr 

Arg 

cys 

Leu 

Ala 

1805 

Val 

Hi s 

Glu 

Cys 

Phe 

1810 

val 

Lys 

Arg 

val 

Asp 

1815 

Trp 

Ser 

val 

Glu 

Tyr 

1820 

pro 

lie 

He 

Gly 

Asp 

1825 

Glu 

Leu 

Arg 

val 

Asn 

1830 

Ser 

Ala 

cys 

Arg 

Lys 

1835 

val 

Gin 

Hi s 

Met 

Val 

1840 

val 

Lys 

Ser 

Ala 

Leu 

1845 

Leu 

Ala Asp 
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Lys 

Phe 

1850 

Pro 

val 

Leu 

His 

Asp 

1855 

lie 

Gly 

Asn 

Pro 

Lys 

1860 

Ala 

lie 

Lys 

cys 

Val 

1865 

Pro 

Gin 

Ala 

Glu 

Val 

1870 

Glu 

Trp 

Lys 

Phe 

Tyr 

1875 

Asp 

Ala Gin 

Pro 

cys 

1880 

Ser 

Asp 

Lys 

Ala 

Tyr 

1885 

Lys 

lie 

Glu 

Glu 

Leu 

1890 

Phe 

Tyr 

ser 

Tyr 

Ala 

1895 

Thr 

His 

His 

Asp 

Lys 

1900 

Phe 

Thr 

ASp 

Gly 

val 

1905 

cys 

Leu 

Phe 

Trp 

Asn 

1910 

Cys 

Asn 

Val 

Asp 

Arg 

1915 

Tyr 

Pro 

Ala 

Asn 

Ala 

1920 

lie 

val 

cys 

Arg 

Phe 

1925 

Asp 

Thr 

Arg 

val 

Leu 

1930 

ser 

Asn 

Leu 

Asn 

Leu 

1935 

Pro 

Gly Cys 

Asp 

Gly 

1940 

Gly 

ser 

Leu 

Tyr 

val 

1945 

Asn 

Lys 

His 

Ala 

Phe 

1950 

His 

Thr 

Pro 

Ala 

Phe 

1955 

Asp 

Lys 

Ser 

Ala 

Phe 

1960 

Thr 

Asn 

Leu 

Lys 

Gin 

1965 

Leu 

Pro 

Phe 

Phe 

Tyr 

1970 

Tyr 

Ser 

Asp 

Ser 

Pro 

1975 

cys 

Glu 

Ser 

His 

Gly 

1980 

Lys 

Gin 

Val 

val 

Ser 

1985 

Asp 

lie 

Asp 

Tyr 

val 

1990 

Pro 

Leu 

Lys 

Ser 

Ala 

1995 

Thr 

Cys 

lie 

Thr 

Arg 

2000 

cys 

Asn 

Leu 

Gly 

Gly 

2005 

Ala 

val 

cys 

Arg 

Hi s 
2010 

His 

Ala 

Asn 

Glu 

Tyr 

2015 

Arg 

Gin 

Tyr 

Leu 

Asp 

2020 

Ala 

Tyr 

Asn 

Met 

Met 

2025 

lie 

Ser 

Ala 

Gly 

Phe 

2030 

ser 

Leu 

Trp 

lie 

Tyr 

2035 

Lys 

Gin 

Phe 

Asp 

Thr 

2040 

Tyr 

Asn 

Leu 

Trp 

Asn 

2045 

Thr 

Phe 

Thr 

Arg 

Leu 

2050 

Gin 

Ser 

Leu 

Glu 

Asn 

2055 

val 

Ala Tyr 

Asn 

Val 

2060 

Val 

Asn 

Lys 

Gly 

His 

2065 

Phe 

Asp 

Gly 

His 

Ala 

2070 

Gly 

Glu 

Ala 

Pro 

Val 

2075 

Ser 

lie 

lie 

Asn 

Asn 

2080 

Ala 

Val 

Tyr 

Thr 

Lys 

2085 

Val 

Asp Gly 

lie 

Asp 

2090 

val 

Glu 

lie 

Phe 

Glu 

2095 

Asn 

Lys 

Thr 

Thr 

Leu 

2100 

Pro 

val 

Asn 
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Val 

Ala 

2105 

Phe 

Glu 

Leu 

Trp 

Ala 

2110 

Lys 

Arg 

Asn 

lie 

Lys 

2115 

Pro 

val 

Pro 

Glu 

lie 

2120 

Lys 

lie 

Leu 

Asn 

Asn 

2125 

Leu Gly 

val 

Asp 

lie 

2130 

Ala 

Ala 

Asn 

Thr 

Val 

2135 

lie 

Trp 

Asp 

Tyr 

Lys 

2140 

Arg 

Glu 

Ala 

pro 

Ala 

2145 

Hi s 

val 

Ser 

Thr 

lie 

2150 

Gly 

val 

Cys 

Thr 

Met 

2155 

Thr 

Asp 

lie 

Ala 

Lys 

2160 

Lys 

Pro 

Thr 

Glu 

Ser 

2165 

Ala 

cys 

Ser 

Ser 

Leu 

2170 

Thr 

val 

Leu 

Phe 

Asp 

2175 

Gly 

Arg 

val 

Glu 

Gly 

2180 

Gin 

val 

Asp 

Leu 

Phe 

2185 

Arg 

Asn 

Ala 

Arg 

Asn 

2190 

Gly 

Val 

Leu 

lie 

Thr 

2195 

Glu 

Gly 

Ser 

Val 

Lys 

2200 

Gly Leu 

Thr 

Pro 

Ser 

2205 

Lys 

Gly Pro 

Ala 

Gin 

2210 

Ala 

ser 

Val 

Asn 

Gly 

2215 

val 

Thr 

Leu 

lie 

Gly 

2220 

Glu 

ser 

val 

Lys 

Thr 

2225 

Gin 

Phe 

Asn 

Tyr 

Phe 

2230 

Lys 

Lys 

val 

Asp 

Gly 

2235 

lie 

lie 

Gin 

Gin 

Leu 

2240 

Pro 

Glu 

Thr 

Tyr 

Phe 

2245 

Thr 

Gin 

ser 

Arg 

Asp 

2250 

Leu 

Glu 

Asp 

Phe 

Lys 

2255 

Pro 

Arg 

Ser 

Gin 

Met 

2260 

Glu 

Thr 

Asp 

Phe 

Leu 

2265 

Glu 

Leu 

Ala 

Met 

Asp 

2270 

Glu 

Phe 

lie 

Gin 

Arg 

2275 

Tyr 

Lys 

Leu 

Glu 

Gly 

2280 

Tyr 

Ala 

Phe 

Glu 

Hi s 
2285 

lie 

val 

Tyr 

Gly 

Asp 

2290 

Phe 

Ser 

His 

Gly 

Gin 

2295 

Leu 

Gly Gly 

Leu 

His 

2300 

Leu 

Met 

lie 

Gly 

Leu 

2305 

Ala 

Lys 

Arg 

ser 

Gin 

2310 

Asp 

ser 

Pro 

Leu 

Lys 

2315 

Leu 

Glu 

Asp 

Phe 

lie 

2320 

Pro 

Met 

Asp 

Ser 

Thr 

2325 

val 

Lys 

Asn 

Tyr 

Phe 

2330 

lie 

Thr 

Asp 

Ala 

Gin 

2335 

Thr Gly 

ser 

ser 

Lys 

2340 

cys 

val 

Cys 

Ser 

Val 

2345 

lie 

Asp 

Leu 

Leu 

Leu 

2350 

Asp 

Asp 

Phe 

Val 

Glu 

2355 

lie 

lie 

Lys 
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Ser 

Gin 

2360 

Asp 

Leu 

Ser 

val 

He 

2365 

Ser 

Lys 

Val 

Val 

Lys 

2370 

Val 

Thr 

lie 

Asp 

Tyr 

2375 

Ala 

Glu 

He 

Ser 

Phe 

2380 

Met 

Leu 

Trp 

cys 

Lys 

2385 

Asp 

Gly His 

Val 

GlU 

2390 

Thr 

Phe 

Tyr 

Pro 

Lys 

2395 

Leu 

Gin 

Ala 

Ser 

Gin 

2400 

Ala 

Trp Gin 

Pro 

Gly 

2405 

Val 

Ala 

Met 

Pro 

Asn 

2410 

Leu 

Tyr 

Lys 

Met 

Gin 

2415 

Arg 

Met 

Leu 

Leu 

Glu 

2420 

Lys 

Cys 

Asp 

Leu 

Gin 

2425 

Asn 

Tyr 

Gly 

Glu 

Asn 

2430 

Ala 

val 

lie 

Pro 

Lys 

2435 

Gly 

lie 

Met 

Met 

Asn 

2440 

val 

Ala 

Lys 

Tyr 

Thr 

2445 

Gin 

Leu 

cys 

Gin 

Tyr 

2450 

Leu 

Asn 

Thr 

Leu 

Thr 

2455 

Leu 

Ala 

Val 

Pro 

Tyr 

2460 

Asn 

Met Arg 

Val 

lie 

2465 

Hi s 

Phe 

Gly 

Ala 

Gly 

2470 

Ser 

Asp 

Lys 

Gly 

val 

2475 

Ala 

Pro Gly 

Thr 

Ala 

2480 

val 

Leu 

Arg 

Gin 

Trp 

2485 

Leu 

Pro 

Thr 

Gly 

Thr 

2490 

Leu 

Leu 

val 

Asp 

Ser 

2495 

Asp 

Leu 

Asn 

Asp 

Phe 

2500 

Val 

Ser 

Asp 

Ala 

Asp 

2505 

ser 

Thr 

Leu 

lie 

Gly 

2510 

Asp 

cys 

Ala 

Thr 

Val 

2515 

His 

Thr 

Ala 

Asn 

Lys 

2520 

Trp 

Asp 

Leu 

lie 

lie 

2525 

Ser 

Asp 

Met 

Tyr 

Asp 

2530 

Pro 

Arg 

Thr 

Lys 

Hi s 
2535 

val 

Thr 

Lys 

Glu 

Asn 

2540 

Asp 

Ser 

Lys 

Glu 

Gly 

2545 

Phe 

Phe 

Thr 

Tyr 

Leu 

2550 

Cys 

Gly Phe 

lie 

Lys 

2555 

Gin 

Lys 

Leu 

Ala 

Leu 

2560 

Gly 

Gly 

Ser 

He 

Ala 

2565 

Val 

Lys 

He 

Thr 

Glu 

2570 

His 

Ser 

Trp 

Asn 

Ala 

2575 

Asp 

Leu 

Tyr 

Lys 

Leu 

2580 

Met 

Gly His 

Phe 

Ser 

2585 

Trp 

Trp 

Thr 

Ala 

Phe 

2590 

Val 

Thr 

Asn 

Val 

Asn 

2595 

Ala 

ser 

Ser 

Ser 

Glu 

2600 

a! a 

Phe 

Leu 

lie 

Gly 

2605 

Ala 

Asn 

Tyr 

Leu 

Gly 

2610 

Lys 

Pro 

Lys 
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Glu 

Gin 

2615 

lie 

Asp Gly Tyr Thr 
2620 

Met 

Hi s 

Ala 

Asn 

Tyr 

2625 

lie 

Phe 

Trp 

5 

Arg 

Asn 

2630 

Thr 

Asn 

Pro 

lie 

Gin 

2635 

Leu 

Ser 

Ser 

Tyr 

ser 

2640 

Leu 

Phe Asp 

10 

Met 

ser 

2645 

Lys 

Phe 

Pro 

Leu 

Lys 

2650 

Leu 

Arg Gly Thr 

Ala 

2655 

val 

Met 

Ser 


Leu 

Lys 

2660 

Glu 

Asn 

Gin 

lie 

Asn 

2665 

Asp 

Met 

lie 

Tyr 

Ser 

2670 

Leu 

Leu 

Glu 

15 

Lys 

Gly 

2675 

Arg 

Leu 

lie 

lie 

Arg 

2680 

Glu 

Asn 

Asn 

Arg 

Val 

2685 

val 

val 

Ser 

20 

Ser 

Asp 

2690 

lie 

Leu 

Val 

Asn 

Asn 

2695 










<210> 76 
< 211 > 20 

25 <212> DNA 

<213> Artificial sequence 

< 220 > 

<223> amorce S/L3/+/4932 

30 

<400> 76 20 

ccacacacag cttgtggata 20 

<210> 77 
35 <211 >20 

<212> DNA 

<213> Artificial sequence 
< 220 > 

40 <223> amorce S/L4/+/6401 

<400> 77 20 

ccgaagttgt aggcaatgtc 20 

45 <210> 78 

< 211 > 20 
<212> DNA 

<213> Artificial sequence 

50 <220> 

<223> amorce S/L4/+/6964 

<400> 78 

tttggtgctc cttcttattg 20 

55 

<210> 79 
< 211 > 20 
<212> DNA 
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<213> Artificial sequence 
< 220 > 

<223> amorce S/L4/-/6817 
<400> 79 

ccggcatcca aacataattt 20 

<210> 80 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L5/-/7633 
<400> 80 

tggtcagtag ggttgattgg 20 

<210> 81 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> S/L5/-/8127 
<400>81 

catcctttgt gtcaacatcg 20 

<210> 82 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L5/-/8633 
<400> 82 

gtcacgagtg acaccatcct 20 

<210> 83 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L5/+/7839 
<400> 83 

atgcgacgag tctgcttcta 20 

<210> 84 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 
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<223> amorce S/L5/+/8785 
<400> 84 

ttcatagtgc ctggcttacc 20 

<210> 85 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L5/+/8255 
<400> 85 

atcttggcgc atgtattgac 20 

<210> 86 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L6/-/9422 
<400> 86 

tgcattagca gcaacaacat 20 

<210> 87 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L6/-/9966 
<400> 87 

tctgcagaac agcagaagtg 20 

< 210 > 88 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L6/-/10542 
<400> 88 

cctgtgcagt ttgtctgtca 20 

<210> 89 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L6/+/10677 
<400> 89 
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ccttgtggca atgaagtaca 20 

<210> 90 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L6/+/10106 
<400> 90 

atgtcatttg cacagcagaa 20 

<210> 91 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L6/+/9571 
<400> 91 

cttcaatggt ttgccatgtt 20 

<210> 92 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L7/-/11271 
<400> 92 

tgcgagctgt catgagaata 20 

<210> 93 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L7/-/11801 
<400> 93 

aaccgagagc agtaccacag 20 

<210> 94 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L7/-/12383 
<400> 94 

tttggctgct gtagtcaatg 20 
<210> 95 
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< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L7/+/12640 
<400> 95 

ctacgacaga tgtcctgtgc 20 

<210> 96 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L7/+/12088 
<400> 96 

gagcaggctg tagctaatgg 20 

<210> 97 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L7/+/11551 
<400> 97 

ttaggctatt gttgctgctg 20 

<210> 98 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L8/-/13160 
<400> 98 

cagacaacat gaagcaccac 20 

<210> 99 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L8/-/13704 
<400> 99 

cgctgacgtg atatatgtgg 20 

< 210 > 100 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
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< 220 > 

<223> amorce S/L8/-/14284 
<400> 100 

tgcacaatga aggatacacc 20 

<210> 101 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L8/+/14453 
<400> 101 

acatagctcg cgtctcagtt 20 

<210> 102 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L8/+/13968 
<400> 102 

ggcattgtag gcgtactgac 20 

<210> 103 
<211> 19 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L8/+/13401 
<400> 103 

gtttgcggtg taagtgcag 19 

<210> 104 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L9/-/15098 
<400> 104 

tagtggcggc tattgacttc 20 

<210> 105 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L9/-/15677 


186 


5 

10 

15 

20 

25 

30 

35 

40 

45 

50 

55 


EP 1 694 829 B1 


<400> 105 

ctaaaccttg agccgcatag 20 

<210> 106 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L9/-/16247 
<400> 106 

catggtcata gcagcacttg 20 

<210> 107 
< 211>21 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L9/+/16323 
<400> 107 

ccaggttgtg atgtcactga t 21 

<210> 108 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L9/+/15858 
<400> 108 

ccttacccag atccatcaag 20 

<210> 109 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/L9/+/15288 
<400> 109 

cgcaaacata acacttgctg 20 

<210> 110 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 0/-/16914 
<400> 110 

agtgttgggt acaagccagt 20 
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<210> 111 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 0/-/17466 
<400> 111 

gttccaagga acatgtctgg 20 

< 210 > 112 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 0/-/18022 
<400> 112 

aggtgcctgt gtaggatgaa 20 

<210> 113 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 0/+/18245 
<400> 113 

gggctgtcat gcaactagag 20 

<210> 114 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 0/+/17663 
<400> 114 

tcttacacgc aatcctgctt 20 

<210> 115 
< 211 > 20 
<212> DNA 

<213> Artificiel sequence 
< 220 > 

<223> amorce S/Ll 0/+/17061 
<400> 115 

tacccatctg ctcgcatagt 20 

<210> 116 
<211> 20 
<212> DNA 
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<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 1/-/18877 
<400> 116 

gcaagcagaa ttaaccctca 20 

<210> 117 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 1/-/19396 
<400> 117 

agcaccacct aaattgcatc 20 

<210> 118 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 1/-/20002 
<400> 118 

tggtcccttt gaaggtgtta 20 

<210> 119 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 1/+/20245 
<400> 119 

tcgaacacat cgtttatgga 20 

<210> 120 
<211> 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce S/Ll 1/+/19611 
<400> 120 

gaagcacctg tttccatcat 20 

< 210 > 121 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 
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<223> amorce S/Ll 1/+/19021 
<400> 121 

acgatgctca gccatgtagt 20 

< 210 > 122 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARS/L1/F3/+/800 
<400> 122 

gaggtgcagt cactcgctat 20 

<210> 123 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARS/L1/F4/+/1391 
<400> 123 

cagagattgg acctgagcat 20 

<210> 124 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARS/L1/F5/+/1925 
<400> 124 

cagcaaacca ctcaattcct 20 

<210> 125 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARS/L1/R3/-/1674 
<400> 125 

aaatgatggc aacctcttca 20 

<210> 126 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARS/L1/R4/-/1107 
<400> 126 
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cacgtggttg aatgactttg 20 

<210> 127 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SARS/L1/R5/-/520 
<400> 127 

atttctgcaa ccagctcaac 20 

<210> 128 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARS/L2/F3/+/2664 
<400> 128 

cgcattgtct cctggtttac 20 

<210> 129 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SARS/L2/F4/+/3232 
<400> 129 

gagattgagc cagaaccaga 20 

<210> 130 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SARS/L2/F5/+/3746 
<400> 130 

atgagcaggt tgtcatggat 20 

<210> 131 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SARS/L2/R3/-/3579 
<400> 131 

ctgccttaag aagctggatg 20 
<210> 132 
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< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SARS/L2/R4/-/2991 
<400> 132 

tttcttcacc agcatcatca 20 

<210> 133 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SARS/L2/R5/-/2529 
<400> 133 

caccgttctt gagaacaacc 20 

<210> 134 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SARS/L3/F3/+/4708 
<400> 134 

tctttggctg gctcttacag 20 

<210> 135 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SRAS/L3/F4/+/5305 
<400> 135 

gctggtgatg ctgctaactt 20 

<210> 136 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 


< 220 > 

<223> amorce SARS/L3/F5/+/5822 
<400> 136 

ccatcaagcc tgtgtcgtat 20 

<210> 137 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
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< 220 > 

<223> amorce SARS/L3/R3/-/5610 
<400> 137 

caggtggtgc agacatcata 20 

<210> 138 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARS/L3/R4/-/4988 
<400> 138 

aacatcagca ccatccaagt 20 

<210> 139 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARS/L3/R5/-/4437 
<400> 139 

atcggacacc atagtcaacg 20 

<210> 140 
<211> 7788 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> gene S synthetique 
<400> 140 
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180 

240 

300 

360 

420 

480 

540 
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720 

780 

840 

900 
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tcaatattgg ccattagcca tattattcat 
ttggccattg catacgttgt atctatatca 
aatatgaccg ccatgttggc attgattatt 
gtcattagtt catagcccat atatggagtt 
gcctggctga ccgcccaacg acccccgccc 
agtaacgcca atagggactt tccattgacg 
ccacttggca gtacatcaag tgtatcatat 
cggtaaatgg cccgcctggc attatgccca 
gcagtacatc tacgtattag tcatcgctat 
caatgggcgt ggatagcggt ttgactcacg 
caatgggagt ttgttttggc accaaaatca 
cgccccgttg acgcaaatgg gcggtaggcg 
tcgtttagtg aaccgtcaga tcactagaag 
tgctaacgca gtcagtgctt ctgacacaac 
gtgaggcact gggcaggtaa gtatcaaggt 
actgggcttg tcgagacaga gaagactctt 


tggttatata gcataaatca atattggcta 
taatatgtac atttatattg gctcatgtcc 
gactagttat taatagtaat caattacggg 
ccgcgttaca taacttacgg taaatggccc 
attgacgtca ataatgacgt atgttcccat 
tcaatgggtg gagtatttac ggtaaactgc 
gccaagtccg ccccctattg acgtcaatga 
gtacatgacc ttacgggact ttcctacttg 
taccatggtg atgcggtttt ggcagtacac 
gggatttcca agtctccacc ccattgacgt 
acgggacttt ccaaaatgtc gtaataaccc 
tgtacggtgg gaggtctata taagcagagc 
ctttattgcg gtagtttatc acagttaaat 
agtctcgaac ttaagctgca gaagttggtc 
tacaagacag gtttaaggag accaatagaa 
gcgtttctga taggcaccta ttggtcttac 
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tgacatccac tttgcctttc tctccacagg 

tgtccactcc 

cagttcaatt 

acagctctta 

1020 

aggctagagt acttaatacg 

actcactata 

ggctagcgga tccaccatgt 

tcatcttcct 

1080 

gctgttcctg accctgacca gcggcagcga cctggaccgg 

tgcaccacct 

tcgacgacgt 

1140 

gcaggccccc 

aactacaccc 

agcacaccag 

cagcatgcgg 

ggcgtgtact 

accccgacga 

1200 

gatctttcgg 

agcgacaccc tgtacctgac 

ccaggacctg 

ttcctgccct 

tctacagcaa 

1260 

cgtgaccggc 

ttccacacca 

tcaaccacac 

cttcggcaac 

cccgtgatcc 

ccttcaagga 

1320 

cggcatctac 

ttcgccgcca 

ccgagaagag 

caacgtggtg 

cggggctggg 

tgttcggcag 

1380 

caccatgaac 

aacaagagcc 

agagcgtgat 

catcatcaac 

aacagcacca 

acgtggtgat 

1440 

ccgggcctgc 

aacttcgagc 

tgtgcgacaa 

ccccttcttc 

gccgtgtcca 

aacccatggg 

1500 

cacccagacc 

cacaccatga 

tcttcgacaa 

cgccttcaac 

tgcaccttcg 

agtacatcag 

1560 

cgacgccttc 

agcctggacg 

tgagcgagaa 

gagcggcaac 

ttcaagcacc 

tgcgggagtt 

1620 

cgtgttcaag 

aacaaggacg 

gcttcctgta 

cgtgtacaag 

ggctaccagc 

ccatcgacgt 

1680 

ggtgagagac 

ctgcccagcg 

gcttcaacac 

cctgaagccc 

atcttcaagc 

tgcccctggg 

1740 

catcaacatc 

accaacttcc 

gggccatcct 

gaccgccttt 

agccctgccc 

aggacatctg 

1800 

gggcaccagc 

gccgccgcct 

acttcgtggg 

ctacctgaag 

cctaccacct 

tcatgctgaa 

1860 

gtacgacgag 

aacggcacca 

tcaccgacgc 

cgtggactgc 

agccagaacc 

ccctggccga 

1920 

gctgaagtgc 

agcgtgaaga 

gcttcgagat 

cgacaagggc 

atctaccaga 

ccagcaactt 

1980 

cagagtggtg 

cctagcggcg 

atgtggtgcg 

gttccccaat 

atcaccaacc 

tgtgcccctt 

2040 

cggcgaagtg 

ttcaacgcca 

ccaagttccc 

cagcgtgtac 

gcctgggagc 

ggaagaagat 

2100 

cagcaactgc 

gtggccgact 

acagcgtgct 

gtacaactcc 

accttcttca 

gcaccttcaa 

2160 

gtgctacggc 

gtgagcgcca 

ccaagctgaa 

cgacctgtgc 

ttcagcaacg 

tgtacgccga 

2220 

cagcttcgtg 

gtgaagggcg 

acgacgtgag 

acagatcgcc 

cctggccaga 

ccggcgtgat 

2280 

cgccgactac 

aactacaagc 

tgcccgacga 

cttcatgggc 

tgcgtgctgg 

cctggaacac 

2340 

ccggaacatc 

gacgccacaa 

gcaccggcaa 

ctacaattac 

aagtaccgct 

acctgcggca 

2400 

cggcaagctg 

cggcccttcg 

agcgggacat 

ctccaacgtg 

cccttcagcc 

ccgacggcaa 

2460 

gccctgcacc 

ccccctgccc 

tgaactgcta 

ctggcccctg 

aacgactacg 

gcttctacac 

2520 

caccaccggc 

atcggctatc 

agccctacag 

agtggtggtg 

ctgagcttcg 

agctgctgaa 

2580 

cgcccctgcc 

accgtgtgcg 

gccccaagct 

gagcaccgac 

ctgatcaaga 

accagtgcgt 

2640 

gaacttcaac 

ttcaacggcc 

tgaccggcac 

cggcgtgctg 

acccccagca 

gcaagcgctt 

2700 

ccagcccttc 

cagcagttcg 

gccgggatgt 

gagcgacttc 

accgacagcg 

tgcgggaccc 

2760 

caagaccagc 

gagatcctgg 

acatcagccc 

ctgcagcttc 

ggcggcgtgt 

ccgtgatcac 

2820 

ccccggcacc 

aacgccagca 

gcgaagtggc 

cgtgctgtac 

caggacgtga 

actgcaccga 

2880 

cgtgagcacc 

gccatccacg 

ccgaccagct 

gacccccgcc 

tggcggatct 

acagcaccgg 

2940 

gaacaacgtg 

ttccagaccc 

aggccggctg 

cctgatcggc 

gccgagcacg 

tggacaccag 

3000 
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3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 
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ctacgagtgc gacatcccca 
gctgcggagc accagccaga 
cagcatcgcc tacagcaaca 
caccgaagtg atgcccgtga 
cggcgacagc accgagtgcg 
gaaccgggcc ctgagcggca 
ccaagtgaag cagatgtata 
tcagatcctg cccgaccctc 
caacaaagtg accctggccg 
catcaacgcc cgggacctga 
cctgctgacc gacgacatga 
cgccggctgg accttcggag 
ctaccggttc aacggcatcg 
cgccaaccag ttcaacaagg 
cgccctgggc aagctgcagg 
gaagcagctg agcagcaact 
gctggacaaa gtggaggccg 
cctgcagacc tacgtgaccc 
tctggccgcc accaagatga 
cggcaagggc tatcacctga 
gcacgtgacc tacgtgccta 
cgagggcaag gcctacttcc 
catcacccag cgcaacttct 
cggcaactgt gatgtggtga 
cgagctggac agcttcaagg 
cgtggacctg ggcgatatca 
cgacagactg aacgaagtgg 
gggcaagtac gagcagtaca 
cctgatcgcc atcgtgatgg 
cctgaaaggc gcctgcagct 
cgtgctgaag ggcgtgaagc 
tctagagtcg acccgggcgg 
gacaaaccac aactagaatg 
ttgctttatt tgtaaccatt 


ttggcgccgg aatctgcgcc 
agtccatcgt ggcctacacc 
acaccatcgc catccccacc 
gcatggccaa gacaagcgtg 
ccaacctgct gctgcagtac 
tcgccgccga gcaggaccgg 
agacccccac cctgaagtac 
tgaagcccac caagcgctcc 
acgccggctt tatgaagcag 
tctgcgccca gaagtttaac 
tcgccgccta tacagccgcc 
ccggagccgc cctgcagatc 
gcgtgaccca gaacgtgctg 
ccatcagcca gatccaggag 
acgtggtgaa ccagaacgcc 
tcggcgccat cagctctgtg 
aagtgcagat cgaccggctg 
agcagctgat cagagccgcc 
gcgagtgcgt gctgggccag 
tgagcttccc ccaggccgcc 
gccaggagcg gaacttcacc 
cccgggaggg cgtgttcgtg 
tcagccccca gatcatcacc 
tcggcatcat caataacacc 
aggagctgga caaatacttc 
gcggcatcaa cgcctccgtg 
ccaagaacct gaacgagagc 
tcaagtggcc ctggtacgtg 
tgaccatcct gctgtgctgc 
gtggcagctg ctgcaagttc 
tgcactacac ctgataactc 
ccgcttcgag cagacatgat 
cagtgaaaaa aatgctttat 
ataagctgca ataaacaagt 


agctaccaca ccgtgagcct 
atgagcctgg gcgccgacag 
aacttcagca tctccatcac 
gattgcaaca tgtacatctg 
ggcagcttct gcacccagct 
aacaccagag aagtgttcgc 
ttcgggggct tcaacttctc 
ttcatcgagg acctgctgtt 
tacggcgagt gcctgggcga 
gggctgaccg tgctgccccc 
ctggtgagcg gcaccgccac 
cccttcgcca tgcagatggc 
tacgagaacc agaagcagat 
agcctgacca caaccagcac 
caggccctga acaccctggt 
ctgaacgaca tcctgagcag 
atcaccggac gcctgcagtc 
gagatccggg ccagcgccaa 
agcaagagag tggacttctg 
ccccacggcg tggtgttcct 
accgccccag ccatctgcca 
tttaacggca ccagctggtt 
acagacaaca ccttcgtgtc 
gtgtacgacc ccctgcagcc 
aagaaccaca cctcccccga 
gtgaacatcc agaaggagat 
ctgatcgacc tgcaggagct 
tggctgggct tcatcgccgg 
atgaccagct gctgtagctg 
gacgaggacg acagcgagcc 
gagaattcac gcgtggtacc 
aagatacatt gatgagtttg 
ttgtgaaatt tgtgatgcta 
taacaacaac aattgcattc 
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5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 

6900 

6960 

7020 

7080 
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attttatgtt tcaggttcag 
acaaatgtgg taaaatcgat 
atcgcccttc ccaacagttg 
attaagcgcg gcgggtgtgg 
agcgcccgct cctttcgctt 
tcaagctcta aatcgggggc 
ccgcaaaaaa cttgatttgg 
ttttcgccct ttgacgttgg 
aacaacactc aaccctatct 
ggcctattgg ttaaaaaatg 
attaacgttt acaatttcgc 
cacaccgcat atggtgcact 
cccgacaccc gccaacaccc 
cttacagaca agctgtgacc 
caccgaaacg cgcgagacga 
tgataataat ggtttcttag 
ctatttgttt atttttctaa 
gataaatgct tcaataatat 
cccttattcc cttttttgcg 
tgaaagtaaa agatgctgaa 
tcaacagcgg taagatcctt 
cttttaaagt tctgctatgt 
tcggtcgccg catacactat 
agcatcttac ggatggcatg 
ataacactgc ggccaactta 
ttttgcacaa catgggggat 
aagccatacc aaacgacgag 
gcaaactatt aactggcgaa 
tggaggcgga taaagttgca 
ttgctgataa atctggagcc 
cagatggtaa gccctcccgt 
atgaacgaaa tagacagatc 
cagaccaagt ttactcatat 
ggatctaggt gaagatcctt 


ggggagatgt gggaggtttt 
aaggatccgg gctggcgtaa 
cgcagcctga atggcgaatg 
tggttacgcg cagcgtgacc 
tcttcccttc ctttctcgcc 
tccctttagg gttccgattt 
gtgatggttc acgtagtggg 
agtccacgtt ctttaatagt 
cggtctattc ttttgattta 
agctgattta acaaatattt 
ctgatgcggt attttctcct 
ctcagtacaa tctgctctga 
gctgacgcgc cctgacgggc 
gtctccggga gctgcatgtg 
aagggcctcg tgatacgcct 
acgtcaggtg gcacttttcg 
atacattcaa atatgtatcc 
tgaaaaagga agagtatgag 
gcattttgcc ttcctgtttt 
gatcagttgg gtgcacgagt 
gagagttttc gccccgaaga 
ggcgcggtat tatcccgtat 
tctcagaatg acttggttga 
acagtaagag aattatgcag 
cttctgacaa cgatcggagg 
catgtaactc gccttgatcg 
cgtgacacca cgatgcctgt 
ctacttactc tagcttcccg 
ggaccacttc tgcgctcggc 
ggtgagcgtg ggtctcgcgg 
atcgtagtta tctacacgac 
gctgagatag gtgcctcact 
atactttaga ttgatttaaa 
tttgataatc tcatgaccaa 


ttaaagcaag taaaacctct 
tagcgaagag gcccgcaccg 
gacgcgccct gtagcggcgc 
gctacacttg ccagcgccct 
acgttcgccg gctttccccg 
agagctttac ggcacctcga 
ccatcgccct gatagacggt 
ggactcttgt tccaaactgg 
taagggattt tgccgatttc 
aacgcgaatt ttaacaaaat 
tacgcatctg tgcggtattt 
tgccgcatag ttaagccagc 
ttgtctgctc ccggcatccg 
tcagaggttt tcaccgtcat 
atttttatag gttaatgtca 
gggaaatgtg cgcggaaccc 
gctcatgaga caataaccct 
tattcaacat ttccgtgtcg 
tgctcaccca gaaacgctgg 
gggttacatc gaactggatc 
acgttttcca atgatgagca 
tgacgccggg caagagcaac 
gtactcacca gtcacagaaa 
tgctgccata accatgagtg 
accgaaggag ctaaccgctt 
ttgggaaccg gagctgaatg 
agcaatggca acaacgttgc 
gcaacaatta atagactgga 
ccttccggct ggctggttta 
tatcattgca gcactggggc 
ggggagtcag gcaactatgg 
gattaagcat tggtaactgt 
acttcatttt taatttaaaa 
aatcccttaa cgtgagtttt 
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cgttccactg agcgtcagac 
ttctgcgcgt aatctgctgc 
tgccggatca agagctacca 
taccaaatac tgtccttcta 
caccgcctac atacctcgct 
agtcgtgtct taccgggttg 
gctgaacggg gggttcgtgc 
gatacctaca gcgtgagcta 
ggtatccggt aagcggcagg 
acgcctggta tctttatagt 
tgtgatgctc gtcagggggg 
ggttcctggc cttttgctgg 

<210> 141 
<211> 23 
<212> DNA 

<213> Artificial sequence 
<220 

<223> amorce SNE-S1 

<400 141 23 
ggttgggatt atccaaaatg tga 

<210> 142 
<211> 24 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SNE-AS1 

<400> 142 24 
gcatcatcag aaagaatcat catg 

<210> 143 
< 211>21 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SAR1-S 
<400> 143 

cctctcttgt tcttgctcgc a 21 

<210> 144 
<211 > 21 


cccgtagaaa agatcaaagg 
ttgcaaacaa aaaaaccacc 
actctttttc cgaaggtaac 
gtgtagccgt agttaggcca 
ctgctaatcc tgttaccagt 
gactcaagac gatagttacc 
acacagccca- gcttggagcg 
tgagaaagcg ccacgcttcc 
gtcggaacag gagagcgcac 
cctgtcgggt ttcgccacct 
cggagcctat ggaaaaacgc 
ccttttgctc acatggctcg 


23 


atcttcttga gatccttttt 
gctaccagcg gtggtttgtt 
tggcttcagc agagcgcaga 
ccacttcaag aactctgtag 
ggctgctgcc agtggcgata 
ggataaggcg cagcggtcgg 
aacgacctac accgaactga 
cgaagggaga aaggcggaca 
gagggagctt ccagggggaa 
ctgacttgag cgtcgatttt 
cagcaacgcg gcctttttac 
acagatct 
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<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce SARI-AS 
<400> 144 

tatagtgagc cgccacacat g 21 

<210> 145 
<211 >45 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 145 

ataggatcca ccatgtttat tttcttatta tttcttactc tcact 45 

<210> 146 
<211> 37 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 146 

atactcgagt tatgtgtaat gtaatttgac acccttg 37 

<210> 147 
<211 >45 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 147 

ataggatcca ccatgtttat tttcttatta tttcttactc tcact 45 

<210> 148 
<211> 36 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 148 

acctccggat ttaatatatt gctcatattt tcccaa 36 

<210> 149 
<211> 13 
<212> PRT 

<213> Artificial sequence 
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< 220 > 

<223> extremite N-terminale de la proteine S du SRAS-CoV (acides amines 1 a 13) 
<400> 149 


Met Phe lie Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly 
15 10 


<210> 150 
< 211 > 10 
<212> PRT 

<213> Artificial sequence 
< 220 > 

<223> oligopeptide 
<400> 150 

Ser Gly Asp Tyr Lys Asp Asp Asp Asp Lys 
1 5 10 

<210> 151 
<211> 34 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 151 

actagctagc ggatccacca tgttcatctt cctg 34 

<210> 152 
<211> 33 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 152 

agtatccgga cttgatgtac tgctcgtact tgc 33 

<210> 153 
<211> 59 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> oligonucleotide 
<400> 153 

tatgagcttt tttttttttt tttttttggc atataaatag actcggcgcg ccatctgca 59 
<210> 154 
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<211> 53 
<212> DNA 

<213> Artificial sequence 
<220 

<223> oligonucleotide 
<400 154 

gatggcgcgc cgagtctatt tatatgccaa aaaaaaaaaa aaaaaaaagc tea 53 

<210> 155 
<211 >45 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 155 

ataegtaega ccatgtttat tttettatta tttcttactc tcact 45 

<210> 156 
<211 >40 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 156 

atagegeget cattatgtgt aatgtaattt gacacccttg 40 

<210> 157 
< 211 > 20 
<212> DNA 

<213> Artificial sequence 
< 220 > 

<223> amorce PCR 
<400> 157 

ccatttcaac aatttggccg 20 

<210> 158 
<211 >45 
<212> DNA 

<213> Artificial sequence 
<220 

<223> amorce PCR 
<400> 158 

ataggatccg cgcgctcatt atttatcgtc gtcatcttta taatc 45 


Revendications 

1. Souche isolee ou purifiee de coronavirus humain associe au syndrome respiratoire aigu severe, caracterisee en 
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ce que son genome presente sous la forme d’ADN complementaire un codon serine en position 23220-23222 du 
gene de la proteine S ou un codon glycine en position 25298-25300 du gene de l’ORF3, et un codon alanine en 
position 7918-7920 de I’ORFIa ou un codon serine en position 26857-26859 du gene de la proteine M, lesdites 
positions etant indiquees en reference a la sequence Genbank AY274119.3. 

2. Souche isolee ou purifiee de coronavirus selon la revendication 1, caracterisee en ce que I’equivalent ADN de 
son genome presente une sequence correspondant a la sequence SEQ ID NO : 1. 

3. Polynucleotide isole ou purifie, caracterise en ce que sa sequence est celle du genome de la souche isolee de 
coronavirus selon la revendication 1 ou la revendication 2. 

4. Polynucleotide isole ou purifie selon la revendication 3, caracterise en ce que sa sequence est la SEQ ID NO : 1. 

5. Fragment du polynucleotide selon la revendication 3, caracterise en ce qu’il comprend les ou est constitue des 
bases ou paires de bases consecutives des positions 7919 a 23220, 7919 a 25298,16622 a 23220,19064 a 23220, 
16622 a 25298, 19064 a 25298, 23220 a 24872, 23220 a 26857, 24872 a 25298, ou 25298 a 26857. 

6. Reactif de detection d’un coronavirus associe au SRAS, caracterise en ce qu’il est selectionne dans le groupe 
constitue par une souche isolee de coronavirus selon la revendication 1 ou la revendication 2 et un polynucleotide 
selon I’une quelconque des revendications 3, 4 et 5. 

7. Utilisation d’un produit selectionne dans le groupe constitue par: 

(a) une souche isolee de coronavirus selon la revendication 1 ou la revendication 2, 

(b) un polynucleotide selon la revendication 3, la revendication 4 ou la revendication 5, 

pour la preparation d’un reactif de detection et eventuellement de genotypage d’un coronavirus associe au SRAS. 

8. Kit ou coffret de detection d’un coronavirus associe au SRAS, caracterise en ce qu’il comprend au moins un reactif 
selectionne dans le groupe constitue par: 

- une souche isolee de coronavirus selon la revendication 1 ou la revendication 2 et, 

- un polynucleotide selon la revendication 3, la revendication 4 ou la revendication 5. 


Claims 

1 . Isolated or purified strain of human coronavirus associated with severe acute respiratory syndrome, characterised 
in that its genome exhibits, in the form of complementary DNA, a serine codon at position 23220-23222 of the gene 
for the S protein or a glycine codon at position 25298-25300 of the gene for ORF3, and an alanine codon at position 
7918-7920 for ORFIa or a serine codon at position 26857-26859 of the gene for the M protein, said positions being 
indicated with reference to GenBank sequence AY274119.3. 

2. Isolated or purified coronavirus strain according to Claim 1, characterised in that the DNA equivalent of its genome 
exhibits a sequence corresponding to sequence SEQ ID No. 1. 

3. Isolated or purified polynucleotide, characterised in that its sequence is that of the genome of the isolated coro¬ 
navirus strain according to Claim 1 or Claim 2. 

4. Isolated or purified polynucleotide according to Claim 3, characterised in that its sequence is SEQ ID No. 1. 

5. Fragment of the polynucleotide according to Claim 3, characterised in that it includes or is constituted by the 
consecutive bases or base pairs of positions 7919 to 23220, 7919 to 25298,16622 to 23220,19064 to 23220,16622 
to 25298, 19064 to 25298, 23220 to 24872, 23220 to 26857, 24872 to 25298, or 25298 to 26857. 

6. Reagent for detection of a coronavirus associated with SARS, characterised in that it is selected from the group 
constituted by an isolated coronavirus strain according to Claim 1 or Claim 2 and a polynucleotide according to any 
one of Claims 3, 4 and 5. 
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7. Use of a product selected from the group constituted by 

(a) an isolated coronavirus strain according to Claim 1 or Claim 2, 

(b) a polynucleotide according to Claim 3, Claim 4 or Claim 5, 

for the preparation of a detection reagent and possibly for genotyping of a coronavirus associated with SARS. 

8. Kit or box for detecting a coronavirus associated with SARS, characterised in that it includes at least one reagent 
selected from the group constituted by: 

- an isolated coronavirus strain according to Claim 1 or Claim 2 and, 

- a polynucleotide according to Claim 3, Claim 4 or Claim 5. 


Patentanspriiche 

1. Isolierter Oder gereinigter humaner Coronavirusstamm, der mit dem Schweren Akuten Respiratorischen Syndrom 
assoziiert ist, dadurch gekennzeichnet, dass sein Genom in Form von komplementarer DNA an Position 
23220-23222 des Gens fur das S-Protein ein Serincodon Oder an Position 25298-25300 des Gens fur den ORF3 
ein Glycincodon, und ein Alanincodon an Position 7918-7920 von ORFIa Oder ein Serincodon an Position 
26857-26859 des Gens fur das M-Protein hat, wobei die Positionen in Bezug aufdie Genbanksequenz AY274119.3 
angegeben sind. 

2. Isolierter Oder gereinigter Coronavirusstamm nach Anspruch 1, dadurch gekennzeichnet, dass die DNA, die 
seinem Genom aquivalent ist, eine Sequenz hat, die der Sequenz SEQ ID NO:1 entspricht. 

3. Isoliertes Oder gereinigtes Polynukleotid, dadurch gekennzeichnet, dass seine Sequenz jene des Genoms des 
isolierten Coronavirusstamms nach Anspruch 1 Oder Anspruch 2 ist. 

4. Isoliertes Oder gereinigtes Polynukleotid nach Anspruch 3, dadurch gekennzeichnet, dass seine Sequenz SEQ 
ID NO: 1 ist. 

5. Fragment des Polynukleotids nach Anspruch 3, dadurch gekennzeichnet, dass es die aufeinanderfolgenden 
Basen Oder Basenpaare der Positionen 7919 bis 23220, 7919 bis 25298,16622 bis 23220,19064 bis 23220,16622 
bis 25298, 19064 bis 25298, 23220 bis 24872, 23220 bis 26857, 24872 bis 25298 Oder 25298 bis 26857 umfasst 
Oder aus diesen besteht. 

6. Reagenz zum Nachweis eines mit SARS assoziierten Coronavirus, dadurch gekennzeichnet, dass es ausgewahlt 
ist aus der Gruppe bestehend auseinem isolierten Coronavirusstamm nach Anspruch 1 Oder Anspruch 2 und einem 
Polynukleotid nach einem der Anspruche 3, 4 und 5. 

7. Verwendung eines Produktes ausgewahlt aus der Gruppe bestehend aus: 

(a) einem isolierten Coronavirusstamm nach Anspruch 1 Oder Anspruch 2, 

(b) einem Polynukleotid nach Anspruch 3, Anspruch 4 Oder Anspruch 5, 

zur Flerstellung eines Reagenzes zum Nachweis und gegebenenfalls zur Genotypisierung eines mit SARS assozi¬ 
ierten Coronavirus. 

8. Kit Oder Set zum Nachweis eines mit SARS assoziierten Coronavirus, dadurch gekennzeichnet, dass es wenig- 
stens ein Reagenz umfasst, ausgewahlt aus der Gruppe bestehend aus: 

- einem isolierten Coronavirusstamm nach Anspruch 1 Oder Anspruch 2, und 

- einem Polynukleotid nach Anspruch 3, Anspruch 4 Oder Anspruch 5. 
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X XhoII 



x ScrFI 



X Sau3AI 



x Mval 

> 

< TthHB8I 

x Ndell 


X 

EcoRII 

> 

< TaqI 

x Mf 11 



x Ecll36I 


X Sau3AI 

X Mbol 


X 

DsaV 


X Ndell 

X DpnII 



x BstOI 


x Mboix I 

MnllX Dpnl 



X BstNI 


>< DpnII 

X BstYI 



X BsiLI 


X Dpnl 

X BspAI 


X 

BsaJI 


X BspAI 

>< Bspl43I 



X Apyl 


x Bspl43IX Bglll 

ATATTAGGTT 

TTTACCTACC 

CAGGAAAAGC 

CAACCAACCT 

CGATCTCTTG 

TAGATCTGTT CTCTAAACGA 

10 

20 

30 

40 

50 

60 70 


>< Vnel 
>< SphI 

>< Snol 
>< Rmal 

>< Pael >< Sdul 
>< NspI >< NspII 
>< NspHI >< HgiAI 
X Nlalll >< Bspl286I 
>< Mael >< Bmyl 

>< Tru9I >< ApaLI 

>< Msel >< Bbvl >< Alw441 

>< Dral >< Alul > < Fnu4HI >< Alw21I 

ACTTTAAAAT CTGTGTAGCT GTCGCTCGGC TGCATGCCTA GTGCACCTAC GCAGTATAAA CAATAATAAA 

80 90 100 110 120 130 140 

>< Sfcl 

x Pst I 
X Mnll 
x Ksp632I 

x Hindu > < MboII x Earl 

X Hindi x Maelll X Eamll04I 

TTTTACTGTC GTTGACAAGA AACGAGTAAC TCGTCCCTCT TCTGCAGACT GCTTACGGTT TCGTCCGTGT 

150 160 170 180 190 200 210 

x TthHB8I X Styl 

X TaqI X Rmal X ScrFI 

X Sau3AI x Mael X Neil 

X Ndell X EcoT14I x MspI 

>< Mbol X Ecol30I X Maelll 

X DpnII x BssTlI x Hpall 

X Dpnl X BsaJI X HapII 

x BspAI X Blnl x DsaV 

x Bspl43I x AvrII x Beni 

TGCAGTCGAT CATCAGCATA CCTAGGTTTC GTCCGGGTGT GACCGAAAGG TAAGATGGAG AGCCTTGTTC 

220 230 240 250 260 270 280 

x Rmal 

X Esp3I x Maell 

>< Hindu >< MaeII> < Eco57I x BsmAI X Mael 

X Hindi > < AflUI > < Ddel X Alw26I X BsmBI 

TTGGTGTCAA CGAGAAAACA CACGTCCAAC TCAGTTTGCC TGTCCTTCAG GTTAGAGACG TGCTAGTGCG 

290 300 310 320 330 340 350 


FIGURE 13.1 
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>< Sau96l 
>< PssI 
>< Pall 


>< NspIV 
>< Mall 
>< Haelll 
>< EcoO109I 

x Drallx MboII x Pmll 
X Mnll X Cfrl3I X PmaCI 

x Ksp632I x BsuRI > < Maell 

x Hinfl X BsiZIX EcoNI X Eco72I 

X Earl X BshI X BslI X BsaAI 

X Plel X Eamll04IX Asul X BsiYIX BbrPI x Mnll 

TGGCTTCGGG GACTCTGTGG AAGAGGCCCT ATCGGAGGCA CGTGAACACC TCAAAAATGG CACTTGTGGT 

360 370 380 390 400 410 420 


x Rsal 


x Tru9I 
X SfaNI 


x Rmal x Csp6I X 

x Mael x Alul x Afal X Alul 

CTAGTAGAGC TGGAAAAAGG CGTACTGCCC CAGCTTGAAC 
430 440 450 460 


BspWI 

AGCCCTATGT 

470 


X Msel 

> < MaeII 

GTTCATTAAA CGTTCTGATG 
480 490 



X Pall 



x Haelll 


x Tru9I 

x Gdill 


x Msel 

x Eael 


X Esp4I 

X BsuRI 


X AfIII 

>< BshI 

X Alul 

CCTTAAGCAC 

CAATCACGGC CACAAGGTCG 

TTGAGCTGGT TGCAGAAATG 

500 

510 520 

530 540 


x Rsal 
Mcrl x 
X Csp6I 
x BsmI BsiEI X 
x BscCI x Afal 
GACGGCATTC AGTACGGTCG 
550 560 


X NspI 

X Seal X NspHI 

>< Rsal x Nlalll 

> < Csp6I X BslI X MboII 

x BsrI X BsiYI X MboII 

X Acil X Afal x Afllll X Muni X Acil 

TAGCGGTATA ACACTGGGAG TACTCGTGCC ACATGTGGGC GAAACCCCAA TTGCATACCG CAATGTTCTT 

570 580 590 600 610 620 630 


X TthHB8I 
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X Ndell 
X Mbol 
X DpnII 
> < Dpnl 
X Clal 
X Bsul5I 


X NlalV 


x BspDI 
X BspAI 


X MspI 

X Hpall X 

x HapII >< 

>< CfrlOI >< 

X BscBI >< Alul x 

CTTCGTAAGA ACGGTAATAA GGGAGCCGGT GGTCATAGCT ATGGCATCGA TCTAAAGTCT TATGACTTAG 

640 650 660 670 680 690 700 
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Ddel >< 
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FIGURE 13.2 
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FIGURE 13.3 
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< Ksp632I 

< Earl 

< Eaml1041 
GAATGAAGAG 

1680 


>< MboII Plel >< 

>< BstXI >< SfaNI > < Hinfl 

GTTGCCATCA TTTTGGCATC TTTCTCTGCT TCTACAAGTG CCTTTATTGA CACT AT AAAG AGTCTTGATT 
1690 1700 1710 1720 1730 1740 1750 


>< Plel 
X MaeIXI 
>< Hinfix Acil 


x Styl 
>< Maelll 

X EcoT14I 
X Ecol30I 
>< BssTlI 
x BsaJI 


BslI >< 
BsiYI X 


ACAAGTCTTT CAAAACCATT GTTGAGTCCT GCGGTAACTA TAAAGTTACC AAGGGAAAGC CCGTAAAAGG 


17 60 


1770 


1780 


1790 


1800 

1810 

1820 

X Sau3AI 



>< 

Van91I 



>< Mdell 



>< 

PflMI 



X Mbol 



>< 

Drain 



X DpnII 



X 

BslI 



X Dpnl 

>< 

Tru9I 

>< 

BsiYI 



X BspAI 

>< 

Msel 


X Bbvl 


X Mnll 

>< Bspl4 31 


>< 

AccB7I 

Fnu4HI 

X 


FIGURE 13.5 


221 



EP 1 694 829 B1 


TGCTTGGAAC ATTGGACAAC AGAGATCAGT TTTAACACCA CTGTGTGGTT TTCCCTCACA GGCTGCTGGT 


1830 

1840 

1850 

1860 

1870 

1880 

1890 



x Thai 

X SfaNI 

X MvnI 

X HinPlI 






>< 

HinPlI 
x Hin6I 






>< 

Hin6I 







X Hhal 





X Sau3AI 


X Hhal 





>< Ndell 


>< Cfol 




PvuII > 

X Mbol 


X Cfol 




Psp5I > 

X DpnIX 


X BstUI 




NspBII > 

x Dpnl 

>< 

BssHII 




HphI >< 

X BspAX 


X Bsp50I 




Enu4HI X 

x Bspl43I 

>< AccII 

X Fnu4HI 

>< Bbvl 


Alul > 

GTTATCAGAT CAATTTTTGC 

GCGCACACTT 

GATGCAGCAA ACCACTCAAT TCCTGATTTG 

CAAAGAGCAG 

1900 

1910 

1920 

1930 

1940 

1950 

1960 


>< TthHB8I 

>< Styl 
>< Ncol 
>< Hindu 
>< Hindi 
>< Hinll 

>< EcoT14I 
>< Eco57I 
>< TaqIX Ecol30I 
>< Sail >< Dsal 
>< Rtrl X BssTlI 
>< BsaHI 

>< Bbillx Nlalll 


x Maelll 




>< 

Acyl X Hgal 

X 

Bbvl 


X Maell >< Acclx BsaJI 

HphI >< 

CTGTCACCAT 

ACTTGATGGT 

ATTTCTGAAC 

AGTCATTACG 

TCTTGTCGAC 

GCCATGGTTT 

ATACTTCAGA 

1970 

1980 

1990 

2000 

2010 

2020 

2030 






X Rsal 





x Ndel 

> 

< Csp6I 


>< 

BspMI 


>< Maelll >< BsrI 

>< Afal 

X Ddel 

CCTGCTCACC 

AACAGTGTCA 

TTATTATGGC 

ATATGTAACT 

GGTGGTCTTG 

TACAACAGAC 

TTCTCAGTGG 

2040 

20S0 

2060 

2070 

2080 

2090 

2100 




>< 

StuI 






>< 

Pall 






>< 

Haelll 






>< 

Ecol47I 




X 

Sdul 

>< Ddel 





X 

NspII 

>< 

BsuRI 




X 

Bspl286I 

>< 

BshI 


Ddel X 


>< 

Bmyl 

>< 

Aatl > 

< Mnll 

BfrI x 

TTGTCTAATC 

TTTTGGGCAC 

TACTGTTGAA 

AAACTCAGGC 

CTATCTTTGA 

ATGGATTGAG 

GCGAAACTTA 

2110 

2120 

2130 

2140 

2150 

2160 

2170 




>< Tfil 






x Hinfl 


Tthllll X 


x SfaNI x Bsgl 

x EokI 


AspI X 

GTGCAGGAGT 

TGAATTTCTC 

AAGGATGCTT 

GGGAGATTCT 

CAAATTTCTC 

ATTACAGGTG 

TTTTTGACAT 

2180 

2190 

2200 

2210 

2220 

2230 

2240 
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Tru9I >< 
Msel >< 


Hpal > 
Hindu > 

>< Eco57I Hindi > 

CGTCAAGGGT CAAATACAGG TTGCTTCAGA TAACATCAAG GATTGTGTAA AATGCTTCAT TGATGTTGTT 

2250 2260 2270 2280 2290 2300 2310 


>< Sau3AI 
>< Ndell 


>< Mbol 

> < Maelll 
>< Fbal 
>< DpnII 
>< Dpnl 


>< Sau3AI 
>< Ndell 
>< DpnII 

>< DpnIMboII >< 


>< TthHB8I 
>< TaqI 


>< BspAI 
>< Bspl4 31 
>< BsiQI 
>< Bell 


>< HinPlI 
>< Hin6I 
>< Hhal 
X Cfol 


Ddel >< 

>< Bspl4 31 
>< MboIBfrI >< 

X BspAI Bbsl X 


AACAAGGCAC TCGAAATGTG CATTGATCAA GTCACTATCG CTGGCGCAAA GTTGCGATCA CTCAACTTAG 

2320 2330 2340 2350 2360 2370 2380 


X PvuII 


>< Maell 
>< Bstll07I 
x BsaAI 
X Bbvl 


X Psp5I 
X NspBII 
Fnu4HI >< 

> < Fnu4HI 


>< HphI >< DrdI >< AccI x Alul 

GTGAAGTCTT CATCGCTCAA AGCAAGGGAC TTTACCGTCA GTGTATACGT GGCAAGGAGC AGCTGCAACT 

2390 2400 2410 2420 2430 2440 2450 


X 


>< 


x Tru9I 

x NlalV 
Msel 

X Mnll 
Esp41 

>< Eco64I 
>< BscBI 

>< Nlalll X BanI 

X AfIII X Tfil 

X Bbvl X AccBlI X Maelll >< Hinfl 

ACTCATGCCT CTTAAGGCAC CAAAAGAAGT AACCTTTCTT GAAGGTGATT CACATGACAC AGTACTTACC 

2460 2470 2480 2490 2500 2510 2520 


x Seal 
>< Rsal 

>< NlaHIMnll X 
Mnll x 
x Csp6l 
x HphI X Afal 


> < Xhol 

X TthHB8I 
>< TthHB8I>< TaqI 

> < Slal 

> < PaeR7I 

> < NspIII 

>< HphI >< Hinll 

> < Eco88I 

> < Ccrl 

x Esp3I >< BsaHI 

> < Bcol 

>< BsmAI x Bbill 

> < Aval X Hgal 

X TaqI > < Ama87I>< BsmBI 

>< Ddelx Mnll X AIw26I >< Acyl X Alul 

TCTGAGGAGG TTGTTCTCAA GAACGGTGAA CTCGAAGCAC TCGAGACGCC CGTTGATAGC TTCACAAATG 

2530 2540 2550 2560 2570 2580 2590 
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>< Pall >< Nlalll 
>< HaeIXI >< Mnll 
>< BsuRI >< Ddel >< Tru9I 

>< Alul >< BsrI >< BshI >< BfrI >< Msel 

GAGCTATCGT TGGCACACCA GTCTGTGTAA ATGGCCTCAT GCTCTTAGAG ATTAAGGACA AAGAACAATA 


2600 


2610 


2620 


2630 


2640 


2650 


2660 


>< Vnel 

Tru9I >< 

>< Snol 

>< Sdul 
>< NspII 
Hsel >< 

>< HgiAI 

Bspl286I XBslI >< 
BsiYI >< 
>< Bmyl 
>< ApaLI 

>< Tru9I >< Alw44I 

>< BsrI >< Msel X Alw21I 

CTGCGCATTG TCTCCTGGTT TACTGGCTAC AAACAATGTC TTTCGCTTAA AAGGGGGTGC ACCAATTAAA 
2670 2680 2690 2700 2710 2720 2730 


>< MstI 
>< HinPlI 
>< Hin6I 
>< Hhal 
>< FspI 
>< Fdill 
>< Cfol 
>< Avill 


>< ScrFI 
>< Mval 
>< EcoRII 
>< Ecll36I 
X DsaV 
X BstOI 
>< BstNI 
>< BsmAI 
>< BsiLI 
x Apyl 
>< Alw26I 


>< Tfil 

>< Maelll X MboII > < Maelll >< Hinfl Alul x 

GGTGTAACCT TTGGAGAAGA TACTGTTTGG GAAGTTCAAG GTTACAAGAA TGTGAGAATC ACATTTGAGC 

2740 2750 2760 2770 2780 2790 2800 


>< Rsal 
>< NlalV 
Maelll >< 


>< Sdul 
>< NspII 


>< Msplx Kpnl 
>< Hpall 
>< HapII 
> < Eco64I 
>< Csp6I 

X Tfil X BscBI 


>< MaeII 

>< Hindi! 


>< HgiAI 
>< Bspl286I 
>< Bmyl 


> < BanI 

> < Asp718 
>< Hinfl X Afal 


x Hindi >< Tru9I x Alw21I 


> < AccBlI 


X Afllll X Msel x AccI > < Acc651 

TTGATGAACG TGTTGACAAA GTGCTTAATG AAAAGTGCTC TGTCTACACT GTTGAATCCG GTACCGAAGT 

2810 2820 2830 2840 2850 2860 2870 


X Sau3AI 
X Ndell 
x Mbol 


>< Ddel 
TACTGAGTTT 
2880 


X NspI 
X NspHI 
X Nlalll 

X Mnll X AlwNI 

GCATGTGTTG TAGCAGAGGC TGTTGTGAAG 
2890 2900 2910 


X DpnII 
> < Dpnl 

X MboII X BspAI 
> < BsrI > < Bspl431 
>< Bbsl >< AlwNI 

ACTTTACAAC CAGTTTCTGA TCTCCTTACC 
2920 2930 2940 


X Sau3AI 
>< Ndell 
>< Mbol 
X DpnII 
X Dpnl 
X BspAI 
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X NlalllX Bspl43I >< Alul >< SfaNI 

AACATGGGTA TTGATCTTGA TGAGTGGAGT GTAGCTACAT TCTACTTATT TGATGATGCT GGTGAAGAAA 

2950 2960 2970 2980 2990 3000 3010 


>< MboIX >< 

>< BsaAI 

X HphI >< Maelix 
ACTTTTCATC ACGTATGTAT 
3020 3030 


>< SfaNI 
X Mall 

Gsul X Ksp632l >< Mnll 

X Earl > < MboII 

Bpml X Mnll X Eamll04I x MboII 

TGTTCCTTTT ACCCTCCAGA TGAGGAAGAA GAGGACGATG CAGAGTGTGA 
3040 3050 3060 3070 3080 


> < Rsal 


>< Rsal 


x Nlalll 

>< Mnll >< FokI 

x Csp6l Eco31I >< 

X Csp6I >< MamI BsmAI >< 

X MboII > < Afal >< BsiBI Bsal >< 

>< MboII >< Afal >< BsaBIAlw26I >< 

GGAAGAAGAA ATTGATGAAA CCTGTGAACA TGAGTACGGT ACAGAGGATG ATTATCAAGG TCTCCCTCTG 

3090 3100 3110 3120 3130 3140 3150 


X Nlaivx Pvulix XmnI 
>< Eco64I X Psp51 X TthHB8I 
>< Mnll >< Ddel >< TaqI 

>< BscBIX NspBII X Mnll 
>< BanI X Mnll 

>< AccBlI X Alul >< Asp700I 


>< Mnll >< MboII 

>< Ksp632I >< MboII x MboII 

X BsrI 
MboIIX Bbsl 
AGACTGGCTG GATGATACTA 
3210 3220 


>< Earl 

>< Eamll04I >< 
GAATTTGGTG CCTCAGCTGA AACAGTTCGA GTTGAGGAAG AAGAAGAGGA 
3160 3170 3180 3190 3200 


x Tru9I 

>< FokI >< Msel >< Eco57I 

X Ddel >< BsrIX MboII BsrI X 

CTGAGCAATC AGAGATTGAG CCAGAACCAG AACCTACACC TGAAGAACCA GTTAATCAGT TTACTGGTTA 

3230 3240 3250 3260 3270 3280 3290 


>< Tru9I 
>< Msel 
>< DraI 

TTTAAAACTT ACTGACAATG 
3300 3310 


>< Mnll 

>< Tru9I x Hindlix Tru9I x Drain 

>< Msel X HincIIX Msel X BspWI 

TTGCCATTAA ATGTGTTGAC ATCGTTAAGG AGGCACAAAG TGCTAATCCT 
3320 3330 3340 3350 3360 


X HphI > < Nlalll 

>< Bbvl >< Fnu4HI >< BspMI 

ATGGTGATTG TAAATGCTGC TAACATACAC CTGAAACATG GTGGTGGTGT 
3370 3380 3390 3400 3410 


x Vnel 
X Snol 

> < Sdul 

> < Nsp'II 

> < HgiAI 

> < Bspl286I 

> < Bmyl 
x ApaLI 

>< Alw44I 

> < Alw21I 

AGCAGGTGCA CTCAACAAGG 
3420 3430 


>< Sau96I 
>< Pall 
X NspIV 
>< Haelll 

X NlalV X Ofrl3I 
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>< 

Eco64I 




>< BscBI 

> 

< Tru9I 

X 

BanI 

> 

< Msel 

>< 

AccBllx Nlalll 


X Alul 

CAACCAATGG 

TGCCATGCAA AAGGAGAGTG 

ATGATTACAT 

TAAGCTAAAT 

3440 

3450 3460 

34 70 

3480 


>< BsuRI 
>< BsiZI 

>< BshI >< Mnll 

x Asul X Mnll 
GGCCCTCTTA CAGTAGGAGG 
3490 3500 


X SinI 
X Sau96I 
X NspIV 

>< NspHIX NspHII 
X Eco47I 
X Cfr131 

x Nlalll x BspMI 
>< BsiZI 
>< Bmel8I 
X Avail Mali X 

> < Ddel x NspIX Asul FokI X 

GTCTTGTTTG CTTTCTGGAC ATAATCTTGC TAAGAAGTGT CTGCATGTTG TTGGACCTAA CCTAAATGCA 

3510 3520 3530 3540 3550 3560 3570 


> < Tru9I 
>< Hphl> < Msel 
X Esp4I 

x Alul > < Ndel 

X AflllX Fnu4HI X Bbvl 

GGTGAGGACA TCCAGCTTCT TAAGGCAGCA TATGAAAATT TCAATTCACA GGACATCTTA CTTGCACCAT 

3580 3590 3600 3610 3620 3630 3640 


Rsal X 
Csp6I X 

X Eco57I >< Bcgl Afal x 

TGTTGTCAGC AGGCATATTT GGTGCTAAAC CACTTCAGTC TTTACAAGTG TGCGTGCAGA CGGTTCGTAC 

3650 3660 3670 3680 3690 3700 3710 

x Bsgl >< BspMI 

X Bcgl/a X Alul X Nlalll 

ACAGGTTTAT ATTGCAGTCA ATGACAAAGC TCTTTATGAG CAGGTTGTCA TGGATTATCT TGATAACCTG 

3720 3730 3740 3750 3760 3770 3780 


>< Rmal 

> 

< Mali 

>< 

NlalV 

>< 

X Mael 

X 

Eco57I 

>< 

BscBI 

>< 

AAGCCTAGAG 

TGGAAGCACC 

TAAACAAGAG 

GAGCCACCAA 

ACACAGAAGA 

3790 

3800 

3810 


3820 

3830 


X Mnll 

Tfil X MboII 
Hinfl x Ddel 
TTCCAAAACT GAGGAGAAAT 
3840 3850 


X Tru9I 


X StuI 
X Pall 




>< Msel 

>< Mnll 

>< 

Maelll 



>< 

Haelll 

>< 

Eco0651 



>< 

Ecol47I 

>< 

Eco91I 

x Rsal 


>< 

BsuRI 


Bst: 

X Csp6I 

X TthHB8I 

>< 

BshI 

>< 

BstPI 

x Afal 

X TaqI 

>< 

Aatl 

>< 

BstEII 


CTGTCGTACA GAAGCCTGTC GATGTGAAGC CAAAAATTAA GGCCTGCATT GATGAGGTTA CCACAACACT 

3860 3870 3880 3890 3900 3910 3920 

Tfil X 
Nlalll >< 
Hinfl >< 

>< Ddel >< EcoRV >< Hindlll 
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>< BsrI 
ggaagaaact 
3930 


>< MboII >< Maelll >< Eco32I X Alul 

AAGTTTCTTA CCAATAAGTT ACTCTTGTTT GCTGATATCA ATGGTAAGCT TTACCATGAT 
3940 3950 3960 3970 3980 3990 



X NspI 

X NspHI 
X Nlalll 


>< SfaNI 

X 

Mnll 


> < EcoNI 


X Ddel 


x MboII x BslI 

x Ddel 

x BfrI 


X HphI X BsiYI 

TCTCAGAACA 

TGCTTAGAGG 

TGAAGATATG 

TCTTTCCTTG AGAAGGATGC 

4000 

4010 

4020 

4030 4040 


> < Nlalll 
X FolcI 

ACCTTACATG GTAGGTGATG 
4050 4060 


>< Spel 
X Rmal 

X Mae I X EcoRVx HphI X SfaNI 

>< HphI X Eco32I >< Mnll X Ddel 

TTATCACTAG TGGTGATATC ACTTGTGTTG TAATACCCTC CAAAAAGGCT GGTGGCACTA CTGAGATGCT 

4070 4080 4090 4100 4110 4120 4130 


>< ScrFI 
x Rsal 

x Mval 
>< EcoRII 

>< Ecll36I 
>< DsaV 

x Csp6I X EcoNI 
>< BstOI 
X BstNI 
>< BsiLI 
>< BsaJI 

x BsaAI X BslI 
>< MboII x Maellx Apyl 

x Alul >< BsrI x Afal x BsiYI 

CTCAAGAGCT TTGAAGAAAG TGCCAGTTGA TGAGTATATA ACCACGTACC CTGGACAAGG ATGTGCTGGT 

4140 4150 4160 4170 4180 4190 4200 

>< Tru9I 
>< Msel 

X Ddel X Esp4I X Rsal 

X Mnll X BspWI X Csp6I 

X FokI x Alul x Aflll >< Eco57I x Afal 

TATACACTTG AGGAAGCTAA GACTGCTCTT AAGAAATGCA AATCTGCATT TTATGTACTA CCTTCAGAAG 

4210 4220 4230 4240 4250 4260 4270 


X ScrFI 
x Mval 


X 

> < Ksp632I 

> < Earl > 

> < Eamll04I 

> < DdeI > 

X BspWI x 

CACCTAATGC TAAGGAAGAG 
4280 4290 


XmnI 


x EcoRII 
x Ecll36I 


x Rmal x DsaV 

< Tfilx MboII >< BstOI 

x Mael X BstNI 


< Hinfl X BsiLI 

Asp700I X Apyl 

ATTCTAGGAA CTGTATCCTG GAATTTGAGA 
4300 4310 4320 


Nlalll X 
Ksp632I X 

>< Earl 
£amll04I x 

BsmAI x 
Alw26I x 

GAAATGCTTG CTCATGCTGA 
4330 4340 


X VspI 

x Tru9I >< 
x Msel 
MboII 

X Eco57I 


>< Zsp2I 
PpulOI 
X Nsil 

>< Nlalll 
x Mphl1031 


x FokI 
x FokI 


FIGURE 13. 11 


227 



EP 1 694 829 B1 


>< Asm >< EcoT22I >< BspWI 

X Asel >< Avail! >< Bgll >< Maell 

agagacaaga aaattaatgc ctatatgcat ggatgttaga gccataatgg caaccatcca acgtaagtat 

4350 4360 4370 4380 4390 4400 4410 


>< Tru9I 
X Msel 

>< Mnll 


>< SfaNI 

> < Hindll >< Tfil 

> < HincIIX MboII 

>< DrdI >< Hinfl 


>< Spel 
>< Rmal 
>< MaeI 


AAAGGAATTA AAATTCAAGA GGGCATCGTT 
4420 4430 4440 


GACTATGGTG TCCGATTCTT CTTTTATACT AGTAAAGAGC 
4450 4460 4470 4480 


>< Sfcl 

>< Alul >< Alul 

CTGTAGCTTC TATTATTACG AAGCT GAACT 
4490 4500 4510 


X Maelll 

>< Enu4HI >< Muni 

>< Acil Maelll x 

CTCTAAATGA GCCGCTTGTC ACAATGCCAA TTGGTTATGT 
4520 4530 4540 4550 


>< Tru9I 
x Nlalll 

>< Msel 
x Mnll 
>< Ksp632I 
X Earl 
X Earall04I 
x Bbvl 


x Thai 
>< MvnI 
X MboII 
x HinPlI 
X HinPlI 
>< Hin6I 
X Hin6I 

>< Hhal 
x Hhal 
'>< Fnu4 HI 

X Cfol 
X Cfol 
X BstUI 

X BssHIIX BspWI 
X Bsp50I 
>< AccII 


X Tru9I 
X Msel 

X Alul 


HphI X 


GACACATGGT TTTAATCTTG AAGAGGCTGC GCGCTGTATG CGTTCTCTTA AAGCTCCTGC CGTAGTGTCA 


4560 


4570 


4580 


4590 


4600 


4610 


4620 


x Maelll 

X SfaNI x AlwNI X Mnll x Mnllx Ddel 

GTATCATCAC CAGATGCTGT TACTACATAT AATGGATACC TCACTTCGTC ATCAAAGACA TCTGAGGAGC 

4630 4640 4650 4660 4670 4680 4690 

X SinI 
>< Sau96I 
x NspIV 
X NspHII 


X Sdul 



X Eco47I 


X NspII 



x Cfrl3I 


X HgiAI 



X BsiZI 


>< Bspl2861 



>< Bmel8I 

>< Rsal 

>< Bmyl 



X Avail 

>< Csp6I 

>< Alw21I 



>< Asul 

>< Afal 

ACTTTGTAGA AACAGTTTCT 

TTGGCTGGCT 

CTTACAGAGA 

TTGGTCCTAT TCAGGACAGC 

GTACAGAGTT 

4700 4710 

4720 

4730 

4740 4750 

4760 


> < TthHB8I 

> < TaqI 






>< 

Sdul 



X 

Van91I 

>< 

NspII . 

X Tru9l 

>< Rsal 

>< 

PflMI 

>< 

Eco24I 

X Msel 

X HphI 

>< 

BslI 

>< 

Bspl286I 

X Esp4I 

X Csp6I 

>< 

BsiYI 

>< 

Bmyl Gsul 
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>< Aflll >< Maelll >< Afal >< AccB7I >< BanllBpml >< 

AGGTGTTGAA TTTCTTAAGC GTGGTGACAA AATTGTGTAC CACACTCTGG AGAGCCCCGT CGAGTTTCAT 

4770 4780 4790 4800 4810 4820 4830 

>< Tru9I 

>< Plel >< EcoNI 
>< Mnll >< BslI 
>< BsmAI >< BsiYI 

>< Mnll >< HphX >< HinfIX Alw26Ix Acil >< Msel 

CTTGACGGTG AGGTTCTTTC ACTTGACAAA CTAAAGAGTC TCTTATCCCT GCGGGAGGTT AAGACTATAA 

4840 4850 4860 4870 4880 4890 4900 

>< Alul x Ndel 

AAGTGTTCAC AACTGTGGAC AACACTAATC tccacacaca GCTTGTGGAT atgtctatga catatggaca 


4910 4920 

4930 

4940 

4950 

4960 4970 

>< SinI 





>< Sau96I 





>< NspIV 





>< NspHII 





>< Eco47I 





>< Cfr131 




Nlalll X 

X BsiZI 




>< Nlalll 

x Bine 181 




> < Mnll 

x Avail 


X Maelll x Tru9I 

X Mnll 

x Asul 


x FokI 

x Msel 

. X BspHI 

GCAGTTTGGT CCAACATACT 

TGGATGGTGC 

TGATGTTACA 

AAAATTAAAC CTCATGTAAA TCATGAGGGT 

4980 4990 

5000 

5010 

5020 

5030 5040 




> < ' 

TthHB8I 

x Rsal 



> < ' 

TaqI 

> 

< Rina I 

x SnaBI. 

X Seal 

> 

< Mael 

X Maell X Hindlll 

X Rsal 

x Csp6I 


X Ecol05I 

x Csp6I 

x Afal 


X BsaAI X Alul 

x Afal 

AAGACTTTCT TTGTACTACC 

TAGTGATGAC 

ACACTACGTA 

GTGAAGCTTT CGAGTACTAC CATACTCTTG 

5050 5060 

5070 

5080 

5090 

5100 5110 


X Rsal 





x NspI 




X NspHI 




X Nlalll 



> 

< Csp6I 

X Tru9I 


Mnll > 


X AflUI 

x Msel 


BslI X 


X Afal 

X DraX 


BsiYI X 

ATGAGAGTTT TCTTGGTAGG 

TACATGTCTG 

CTTTAAACCA 

CACAAAGAAA TGGAAATTTC CTCAAGTTGG 

5120 5130 

5140 

5150 

5160 

5170 5180 

>< Tru9I >< Tru9I 


■ x Rina I 


>< Msel x Msel 

x Muni 

x Mael 

Alul > 

TGGTTTAACT TCAATTAAAT 

GGGCTGATAA 

CAATTGTTAT 

TTGTCTAGTG TTTTATTAGC ACTTCAACAG 

5190 5200 

5210 

5220 

5230 

5240 5250 




>< 

SfaNI 




>< 

Sdul 




>< 

NspII 




>< 

Eco24I 




>< 

Bspl286I 




>< 

Brayl HphX > 




>< 

Bbvl Fnu4HI X 


X Mnll 

>< 

Banll x BspWI 
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CTTGAAGTCA AATTCAATGC ACCAGCACTT CAAGAGGCTT ATTATAGAGC CCGTGCTGGT GATGCTGCTA 

5260 5270 5280 5290 5300 5310 5320 

>< Vnel 
>< Snol 

x Sdul 
>< NspII 
>< HgiAI 
>< Bspl286I 
>< Bmyl 
>< ApaLI 

>< Alw44I HboII >< 

>< Alw21I >< Alul >< HphI 

ACTTTTGTGC ACTCATACTC GCTTACAGTA ATAAAACTGT TGGCGAGCTT GGTGATGTCA GAGAAACTAT 

5330 5340 5350 5360 5370 5380 5390 

> < SphI 

> < Pael 

> < NspX 

> < NspHI >< TfiX >< Tru9I 

>< Sfcl > < Nlalllx Hint I X Msel 

GACCCATCTT CTACAGCATG CTAATTTGGA ATCTGCAAAG CGAGTTCTTA ATGTGGTGTG TAAACATTGT 

5400 54X0 5420 5430 5440 5450 5460 

>< Rsal 

x Tru9I > < Csp6I Esp4I > 

>< Msel >< Alul >< Afal Aflll > 

GGTCAGAAAA CTACTACCTT AACGGGTGTA GAAGCTGTGA TGTATATGGG TACTCTATCT TATGATAATC 

5470 5480 5490 5500 5510 5520 5530 

>< Rsal 

>< MboII 
>< RmalHinfl >< 

>< Csp6I 


x Tru9I 


>< 

SfaNI 


X MaeI 

>< Bbsl 

x Msel 


X Nlalll 


X Afal 

TTAAGACAGG 

TGTTTCCATT 

CCATGTGTGT 

GTGGTCGTGA 

TGCTACACAA 

TATCTAGTAC 

AACAAGAGTC 

5540 

5550 

5560 

5570 

5580 

5590 

5600 






X Rsal 


X PleX 


> 

< Ddel 


x Csp6I 


X Bsgl 


>< BspWI X BspMI 


X Afal 


TTCTTTTGTT 

ATGATGTCTG 

CACCACCTGC 

TGAGTATAAA 

TTACAGCAAG 

GTACATTCTT 

ATGTGCGAAT 

5610 

5620 

5630 

5640 

5650 

5660 

5670 





X Eco31I 


X Rsal 




X Ddel 


> 

< MaeXII 



X BsmAI 


X Csp6I 




X Bsal 

Mnl X X 

x Afal 

X BsrI 



X Alw26I 

HphI > 

GAGTACACTG 

GTAACTATCA 

GTGTGGTCAT 

TACACTCATA 

TAACTGCTAA 

GGAGACCCTC 

TATCGTATTG 

5680 

5690 

5700 

57X0 

5720 

5730 

5740 


>< SstI 
>< Sdul 
>< SacI 
>< NspII 
>< HgiAI 
>< Eco24I 
>< Ecll36II 
x Bspl286I 
X Bmyl 


>< SinI 
x Sau96I 
x NspIV 
x NspHII 

> < Rsal x MaeXII 

x Eco47I 
x Cfrl3I 
X BsiZI 
X Bmel8X 

FIGURE 13. 14 
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>< Banll 
>< Alw21I 
>< Alul 


>< 

> 


acggagctca ccttacaaag atgtcagagt 

5750 5760 5770 


>< Avail 
Csp6I>< Asul 
< Afal >< Bsrlx AlwNI 

ACAAAGGACC AGTGACTGAT GTTTTCTACA AGGAAACATC 
5780 5790 5800 5810 


>< TthHB8I 
>< TaqI X Maelll 

TTACACTACA ACCATCAAGC CTGTGTCGTA TAAACTCGAT GGAGTTACTT ACACAGAGAT TGAACCAAAA 

5820 5830 5840 5850 5860 5870 5880 


>< FokI 

TTGGATGGGT ATTATAAAAA GGATAATGCT 
5890 5900 5910 


>< Rsal 
>< Csp6I 
>< Sfcl >< Bbvl 


>< Fnu4HI X Afal 

TACTATACAG AGCAGCCTAT AGACCTTGTA CCAACTCAAC 
5920 5930 5940 5950 


Tru9I x 
Swal X 
Msel X 

> < NspI MamI x 

> < NspHI Dral X 

> < Nlalll BsiBI X 

X Afllll BsaBI X 

CATTACCAAA TGCGAGTTTT GATAATTTCA AACTCACATG TTCTAACACA AAATTTGCTG ATGATTTAAA 

5960 5970 5980 5990 6000 6010 6020 


X MboII 

x Alul X AluXX Maelll 

TCAAATGACA GGCTTCACAA AGCCAGCTTC ACGAGAGCTA TCTGTCACAT TCTTCCCAGA CTTGAATGGC 

6030 6040 6050 6060 6070 6080 6090 


X Sfcl 

GATGTAGTGG CTATTGACTA TAGACACTAT TCAGCGAGTT TCAAGAAAGG TGCTAAATTA CTGCATAAGC 

6100 6110 6120 6130 6140 6150 6160 


x Tru9I 

>< ScrFI 
x Mval 
x Msel 

x EcoRII 

X EC1136I 
X DsaV 


>< BstOI 


x Muni 


>< BstNI 
X BsiLI 


Maell x 
x Drain 


X BstXI >< Apyl X Mae 11 X BstXI 

CAATTGTTTG GCACATTAAC CAGGCTACAA CCAAGACAAC GTTCAAACCA AACACTTGGT GTTTACGTTG 

6170 6180 6190 6200 6210 6220 6230 


> < Rsal 

X Csp6I MboII X 

> < Afalx BsrI >< Bbsl 

TCTTTGGAGT ACAAAGCCAG TAGATACTTC AAATTCATTT GAAGTTCTGG CAGTAGAAGA CACACAAGGA 

6240 6250 6260 6270 6280 6290 6300 


x Hindll 


X MboII 


>< Hindi >< Mali x Eco57I 

ATGGACAATC TTGCTTGTGA AAGTCAACAA CCCACCTCTG AAGAAGTAGT GGAAAATCCT ACCATACAGA 

6310 6320 6330 6340 6350 6360 6370 


FIGURE 13.15 
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>< Maelll 


>< Tru9X 


>< Maell >< Msel 

AGGAAGTCAT AGAGTGTGAC GTGAAAACTA CCGAAGTTGT AGGCAATGTC ATACTTAAAC CATCAGATGA 

6380 6390 6400 6410 6420 6430 6440 


>< XhoXI 
>< Sau3AI 
>< Nlalll 
x Ndell 
x MfII 

X Mbol 
X DpnII 
X Dpnl 
X BstYI 

X Tru9I >< BspAI 

X Msel >< BspHI X Bspl43I>< Fnu4HI 

> < MaeXXI >< Mnll x Bbvl X Alwl 

AGGTGTTAAA GTAACACAAG AGTTAGGTCA TGAGGATCTT ATGGCTGCTT ATGTGGAAAA CACAAGCATT 

6450 6460 6470 6480 6490 6500 6510 


X Saul 
X Rmal 

x Mstll 
X Mael 

x Eco81I 
X Ddel 
x CvnI 
X Bsu36I 
x Bse21I 





x Bfrl> 

< Tru9I 



X Tru9I 


X Axyl> 

< Mselx Muni 

X Nlalll 

X Msel 

>< , 

Alul 

X AocI 

X Dral 

x Bbvl 

Fnu4HI X 

ACCATTAAGA 

AACCTAATGA GCTTTCACTA 

GCCTTAGGTT 

TAAAAACAAT 

TGCCACTCAT 

GGTATTGCTG 

6520 

6530 

6540 

6550 

6560 

6570 

6580 

x VspI 

x Styl 






X Tru9I 

X EcoT14I 



> 

< Ddel 


>< Msel 

x Ecol30I 




X BslI 


>< Asnl 

x BssTlI 




X BsiYI 


>< Asel 

x BsaJI 



> 

< Bfrl 

>< Fnu4HI 

CAATTAATAG 

TGTTCCTTGG AGTAAAATTT 

TGGCTTATGT 

CAAACCATTC 

TTAGGACAAG 

CAGCAATTAC 

6590 

6600 

6610 

6620 

6630 

6640 

6650 


X HinPlI 







X Hin6I 


X 

Tru9I 




X Hhal 


x Maelix 

Msel 




X Ddel 


x Drain 




X Bbvl 

X Cfol 


x Afllll 




AACATCAAAT 

TGCGCTAAGA GATTAGCACA 

ACGTGTGTTT 

AACAATTATA 

TGCCTTATGT 

GTTTACATTA 

6660 

6670 

6680 

6690 

6700 

6710 

6720 


X Rsal 

> 

< Rsalx Xbal 




x Csp6I 

>< 

Csp6I X 

Rmal 



X Muni X Afal 

> 

< Afal X ! 

Mael X 

Alul 


TTGTTCCAAT 

TGTGTACTTT TACTAAAAGT 

ACCAATTCTA 

GAATTAGAGC 

TTCACTACCT 

ACAACTATTG 

6730 

6740 

6750 

6760 

6770 

6780 

6790 





X 

VspI 






X 

Tru9I 






x Nael 







X MspI 







X 

Msel 



FIGURE 13. 16 
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>< Hpall 
>< HapII 

>< CfrlOI >< FokI 

>< Tru9I >< Asnl 

>< Msel X SfaNI >< Aselx Hphix Maelll 

CTAAAAATAG TGTTAAGAGT GTTGCTAAAT TATGTTTGGA TGCCGGCATT AATTATGTGA AGTCACCCAA 

6800 6810 6820 6830 6840 ■ 6850 6860 

x Tru9I >< Ddel Maelll > 

X Msel >< BfrI X Bbvl 

ATTTTCTAAA TTGTTCACAA TCGCTATGTG GCTATTGTTG TTAAGTATTT GCTTAGGTTC TCTAATCTGT 

6870 6880 6890 6900 6910 6920 6930 

x Sdul 
x NspII 
x HgiAI 

> < Rsal X Bspl286I 

>< Csp6I X Bmyl 

X Fnu4HI > < Afal x Alw21I' 

GTAACTGCTG CTTTTGGTGT ACTCTTATCT AATTTTGGTG CTCCTTCTTA TTGTAATGGC GTTAGAGAAT 

6940 6950 6960 6970 6980 6990 7000 

Tru9I >< 
Msel >< 

x Tru9I > < Maelll >< Fnu4HI 

X Msel >< Maell Bbvl > 

TGTATCTTAA TTCGTCTAAC GTTACTACTA TGGATTTCTG TGAAGGTTCT TTTCCTTGCA GCATTTGTTT 

7010 7020 7030 7040 7050 7060 7070 


> < Tfil 
X MamI 

> < Hinfl 
X BsiBI 

X BsaBI x Alul 

AAGTGGATTA GACTCCCTTG ATTCTTATCC AGCTCTTGAA ACCATTCAGG TGACGATTTC ATCGTACAAG 

7080 7090 7100 7110 7120 7130 7140 


>< PleIX Hinfl 


X XmnIX Maelll 
X Asp700I 


Rsal X 
X HphI 
Csp6I >< 

Alul > 
Afal x 


x Pall 

X NspBII 
x Haelll 
X Gdill 

x Fnu4HI 
Gael 

x Ddel 
x BsuRI 

X Rmal X BshI x BslI 

>< Mael x Aciix BsiYI 

CTAGACTTGA CAATTTTAGG TCTGGCCGCT GAGTGGGTTT TGGCATATAT GTTGTTCACA AAATTCTTTT 

7150 7160 7170 7180 7190 7200 7210 


X BspMI 
X Alul 


x Rmal 
x Mael 


ATTTATTAGG 

TCTTTCAGCT 

ATAATGCAGG 

TGTTCTTTGG CTATTTTGCT 

AGTCATTTCA TCAGCAATTC 

7220 

7230 

7240 

7250 7260 

7270 7280 





Rsal x 





x MboII 

• 



x NlalV 

MamI x 




x Eco64I 

Csp6I x 



> 

< Rsal >< BscBI 

BsiBI x 



>< 

Csp6I x BanI 

BsaBI x 

> 

< Nlalll 

> 

< Afalx AccBlI 

Afal x 




FIGURE 13.17 
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ttggctcatg tggtttatca ttagtattgt acaaatggca cccgtttctg caatggttag gatgtacatc 

7290 7300 7310 7320 7330 7340 7350 


>< FokI 
TTCTTTGCTT 
7360 


TthHB8I >< 

>< TaqI 
Mnll >< 

>< Ndel Ksp632I >< 

>< Ksp632I >< FokI 

>< Earl >< MboII Earl >< 

>< Earall04I>< AluXX MboII X Nlalll Eamll04I x 
CTTTCTACTA CATATGGAAG AGCTATGTTC ATATCATGGA TGGTTGCACC TCTTCGACTT 


7370 


7380 


7390 


7400 


7410 


7420 


X Thai 
X MvnI 

X HinPlI X Mlul 

X Hin6I X BstCJI 

X Hhal X Bsp50I X Rsal 

>< Nlalll x Cfol >< Afllll >< Csp6I X 

X BspWI >< BspWI >< AccII >< Afal x 

GCATGATGTG CTATAAGCGC AATCGTGCCA CACGCGTTGA GTGTACAACT ATTGTTAATG GCATGAAGAG 

7430 7440 7450 7460 7470 7480 7490 


XhoII x 
Sau3AI x 
Nlalll x 

NdelI >< 
Mill X 
Mbol X 

< Ksp632I 

< Earl 

< Eamll04I 
DpnII x 
BstYI X 
BspAI X 
Bglll x 


> 

> 

> 


Tru9l 

Msel 


>< Pall 
x Haelll 

x Dsal x Muni 

>< MboII x BsuRI Maelll x 

x Dpnl x BshI >< Muni BsmAI X 

>< Bspl43I >< Mnll X BsaJI X Pleix Hinfl Alw26I X 

ATCTTTCTAT GTCTATGCAA ATGGAGGCCG TGGCTTCTGC AAGACTCACA ATTGGAATTG TCTCAATTGT 

7500 7510 7520 7530 7540 7550 7560 


x Rsal Tru9I >< 

> < Csp6I Msel >< 

>< BsrI >< Gsul >< MaelllDral x 

X Afal X Bpml > < BsrI 

GACACATTTT GCACTGGTAG TACATTCATT AGTGATGAAG TTGCTCGTGA TTTGTCACTC CAGTTTAAAA 

7570 7580 7590 7600 7610 7620 7630 


X Thai 
>< MvnI 
> < HphI 
HinPlI X 

>< HinPlI 
>< Hin6l 
>< Hin6I 
Hhal X 
X Hhal 
Cfol X 

>< Cfol 
>< BsCCJI 
>< BssHII 
Bsp50I >< 

> < BsrI X AccII 

GACCAATCAA CCCTACTGAC CAGTCATCGT ATATTGTTGA TAGTGTTGCT GTGAAAAATG GCGCGCTTCA 

7640 7650 7660 7670 7680 7690 7700 


FIGURE 13. 18 
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>< FokI 






>< BsmAI 





X Mnll 

>< Alw26l 

X Acil 



CCTCTACTTT 

GACAAGGCTG 

GTCAAAAGAC CTATGAGAGA 

CATCCGCTCT 

CCCATTTTGT 

CAATTTAGAC 

7710 

7720 

7730 7740 

7750 

7760 

7770 


>< VspI 
>< Tru9I 
>< Msel 
>< Asnl 

> < Alul >< Asel >< Bcgl/a 

AATTTGAGAG CTAACAACAC TAAAGGTTCA CTGCCTATTA ATGTCATAGT TTTTGATGGC AAGTCCAAAT 

7780 7790 7800 7810 7820 7830 7840 

>< Sfcl >< PvuII 

>< Rsal >< PspSI 

>< Plel x Csp6I >< NspBII 

>< Hinfl >< Ddel >< Bcgl X AfaX >< Alul 

GCGACGAGTC TGCTTCTAAG TCTGCTTCTG TGTACTACAG TCAGCTGATG TGCCAACCTA TTCTGTTGCT 

7850 7860 7870 7880 7890 7900 7910 

TthHB8I >< 
TaqI >< 
Sail >< 
Rtrl >< 

>< Seal Hindll > 

>< Rsal >< Tru9I HincII > 

>< Csp6I >< SfaNI X Eco57I 

>< Alul >< Maell x Afal x Msel AccX >< 

TGACCAAGCT CTTGTATCAG ACGTTGGAGA TAGTACTGAA GTTTCCGTTA AGATGTTTGA TGCTTATGTC 

7920 7930 7940 7950 7960 7970 7980 

>< Tru9I 
>< Msel 

> < Esp4I >< Sfcl 

> < AfIII >< BspWI >< Alul 

GACACCTTTT CAGCAACTTT TAGTGTTCCT ATGGAAAAAC TTAAGGCACT TGTTGCTACA GCTCACAGCG 

7990 8000 8010 8020 8030 8040 8050 

>< PvuII 
>< Psp5I 
>< NspBII 
X Fnu4HI 

>< Alul >< Bbvl >< Alul 

AGTTAGCAAA GGGTGTAGCT TTAGATGGTG TCCTTTCTAC ATTCGTGTCA GCTGCCCGAC AAGGTGTTGT 

8060 8070 8080 8090 8100 8110 8120 

Maelll x 

>< Hindll x BsmAI >< Ddel 

X HincII >< Foklx Alw26I >< BfrI 

TGATACCGAT GTTGACACAA AGGATGTTAT TGAATGTCTC AAACTTTCAC ATCACTCTGA CTTAGAAGTG . 

8130 8140 8150 8160 8170 8180 8190 


FIGURE 13.19 


x XhoII 
Sau3AI x 

>< Ndell 
>< MfII 
>< Mbol 
x Nlalll >< Hgal 
X Hinll X DpnII 
Dpnl x 
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Bspl43I >< 

>< BsaHI >< BstYI 

X Maellix Hphl >< Bbill >< BspAI 

X MaeXII >< Hphl >< Nlalll >< Acyl >< Bglll 

ACAGGTGACA GTTGTAACAA TTTCATGCTC ACCTATAATA AGGTTGAAAA CATGACGCCC AGAGATCTTG 

8200 8210 8220 8230 8240 8250 8260 

>< NspI 
X NspHI 
X Nlalll 
x HinPlI 
x Hin6I 
>< Hhal 

x Cfol x BspWI x Maelll 

GCGCATGTAT TGACTGTAAT GCAAGGCATA TCAATGCCCA AGTAGCAAAA AGTCACAATG TTTCACTCAT 

8270 8280 8290 8300 8310 8320 8330 


X NspI 

X NspHX >< PvuII 

X Nlalll >< Psp5I 

X Eamll05I >< NspBII 

X BbvX X Fnu4HI 

x Afllll >< Alul x Bbvl > < Fnu4HI 

CTGGAATGTA AAAGACTACA TGTCTTTATC TGAACAGCTG CGTAAACAAA TTCGTAGTGC TGCCAAGAAG 

8340 8350 8360 8370 8380 8390 8400 


X MboII 

AACAACATAC CTTTTAGACT AACTTGTGCT 
8410 8420 8430 


X Rmal 

x Mael X EamllOSI 

ACAACTAGAC AGGTTGTCAA TGTCATAACT ACTAAAATCT 
8440 8450 8460 • 8470 


x Tru9I 

X Pall 
x Msel 

>< Haelll 


x Seal 

X Rsal >< Tru9I 


X Esp4I 

>< BsuRI 


X Csp6I >< Msel >< BshI 

X Afal >< DraX X Aflll X Bbvl 

CACTCAAGGG TGGTAAGATT GTTAGTACTT GTTTTAAACT TATGCTTAAG GCCACATTAT TGTGCGTTCT 

8480 8490 8500 8510 8520 8530 8540 


X Rsal 
X Csp6I 

x BsrX >< Nlalll 

X Fnu4KI >< Afal >< Maelll 

TGCTGCATTG GTTTGTTATA TCGTTATGCC AGTACATACA TTGTCAATCC ATGATGGTTA CACAAATGAA 

8550 8560 8570 8580 8590 8600 8610 

x Maelll 
< Maelll 

x FokI 

GTCACTCGTG ACATCATTTC TACTGATGAT TGTTTTGCAA 
8650 8660 8670 8680 

Sfcl > 

X NspI Fnu4HI X 

>< NspHX X Nlalll Bbvl x 

x Nlalll X Hgal X BstXI x Bbvl >< Alul 

ATAAACATGC TGGTTTTGAC GCATGGTTTA GCCAGCGTGG TGGTTCATAC AAAAATGACA AAAGCTGCCC 

8690 8700 8710 8720 8730 8740 8750 


>< Maelll 

ATCATTGGTT ACAAAGCCAT TCAGGATGGT 
8620 8630 8640 


FIGURE 13. 20 
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>< ScrFI 

>< ScrFI >< Rsal 

>< Mval >< MspI 
>< EcoRII >< Hpall 
>< Ecll361x Neil 
>< DsaV >< HapII 
>< BstOIX DsaV 
>< BstNI >< Csp6l 

>< Fnu4HI >< BsiLI >< BcnIDdel >< 

X Alul >< Apyl >< Afal 

TGTAGTAGCT GCTATCATTA CAAGAGAGAT TGGTTTCATA GTGCCTGGCT TACCGGGTAC TGTGCTGAGA 
8760 8770 8780 8790 8800 8810 8820 

> < Maelll >< HphI >< Mnll >< BspWI 

GCAATCAATG GTGACTTCTT GCATTTTCTA CCTCGTGTTT TTAGTGCTGT TGGCAACATT TGCTACACAC 

8830 8840 8850 8860 8870 8880 8890 

Tru9I > 
SfaNI >< 

>< Rsal 
Msel > 

>< BspWI >< Fnu4HI >< Csp6I 

>< Bbvlx Mnll >< Ddel >< Afal 

CTTCCAAACT CATTGAGTAT AGTGATTTTG CTACCTCTGC TTGCGTTCTT GCTGCTGAGT GTACAATTTT 

8900 8910 8920 8930 8940 8950 8960 

> < Rmal 
>< Mnll 

x FokI > < Mael 

TAAGGATGCT ATGGGCAAAC CTGTGCCATA TTGTTATGAC ACTAATTTGC TAGAGGGTTC TATTTCTTAT 

8970 8980 8990 9000 9010 9020 9030 

ScrFI > 
Mval > 
Mnll X 
EcoRII X 
Ecll36I > 
DsaV X 
BstOI > 

X NlalV BstNI > 

x FokI BsiLI > 


X Alul 



x BscBI 


Apyl > 

AGTGAGCTTC 

GTCCAGACAC 

TCGTTATGTG 

CTTATGGATG 

GTTCCATCAT 

ACAGTTTCCT AACACTTACC 

9040 

9050 

9060 

9070 

9080 

9090 

9100 






x Rsal 






X Sfcl 

X 

NspI 





X Seal 

X 

NspHI 



X SfaNI 


X Rsal 

X 

Nlalll 


> 

< MaelII 


X Csp6I 

x Nlalll 




GsuI 


X Afal 

X Csp6I 




x Bpml 

X Ddel X AccI >< Afal 


TGGAGGGTTC 

TGTTAGAGTA 

GTAACAACTT 

TTGATGCTGA 

GTACTGTAGA 

CATGGTACAT GCGAAAGGTC 

9110 

9120 

9130 

9140 

9150 

9160 

9170 


X SstI 
x Sdul 
X SacI 
NspII x 
RgiAI >< 

Eco24I x 
Bspl28 61 X 


FIGURE 13.21 
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Ecll36II ><>< Bmyl 
BanXI >< 

>< Tru9I Alw21I >< 




>< BsrI 


x Msel 


>< Alul 

AGAAGTAGGT 

ATTTGCCTAT 

CTACCAGTGG TAGATGGGTT 

CTTAATAATG 

AGCATTACAG 

AGCTCTATCA 

9180 

9190 

9200 

9210 

9220 

9230 

9240 



X Tfil 





X 

SfaNI 

>< Hinfl 

X Alul 


X Mnll 

GGAGTTTTCT 

GTGGTGTTGA 

TGCGATGAAT CTCATAGCTA 

ACATCTTTAC 

TCCTCTTGTG 

CAACCTGTGG 

9250 

9260 

9270 

9280 

9290 

9300 

9310 


>< Maelll 

HphI >< 

>< Eco57I > < Bbvl Fnu4HI >< 

GTGCTTTAGA TGTGTCTGCT TCAGTAGTGG CTGGTGGTAT TATTGCCATA TTGGTGACTT GTGCTGCCTA 

9320 9330 9340 9350 9360 9370 9380 


>< Rsal 

>< Csp6I >< Nlalll 

>< Maell >< Bbvl >< Fnu4HI 

>< AflXII >< AfalX HphI >< BspWI 

CTACTTTATG AAATTCAGAC GTGTTTTTGG TGAGTACAAC CATGTTGTTG CTGCTAATGC ACTTTTGTTT 

9390 9400 9410 9420 9430 9440 9450 


>< Rsal 
>< NlalV 
>< Kpnl 
>< Eco64I 
>< Csp6I 
>< BscBI 
>< Asp718 
>< BanI >< AluX 
>< Afal 
>< AccBlI 


> < ScrFI 

> < Neil 
>< MspX 
>< Hpall 

>< Hinfl 

>< HapII >< Plel 

> < Beni > < Ddel 


>< Acc65I >< Alulx DsaV >< AccI 

TTGATGTCTT TCACTATACT CTGTCTGGTA CCAGCTTACA GCTTTCTGCC GGGAGTCTAC TCAGTCTTTT 

9460 9470 9480 9490 9500 9510 9520 


X Rsal 
>< Csp6I 

>< Afal >< HphI >< HphI Nlalll >< 

ACTTGTACTT GACATTCTAT TTCACCAATG ATGTTTCATT CTTGGCTCAC CTTCAATGGT TTGCCATGTT 

9530 9540 9550 9560 9570 9580 9590 

TTCTCCTATT GTGCCTTTTT GGATAACAGC AATCTATGTA TTCTGTATTT CTCTGAAGCA CTGCCATTGG 

9600 9610 9620 9630 9640 9650 9660 


X TthHB8I 
>< Rsal 
>< Mnll 
X Mnll 

X Tru9I >< Csp6I 

>< Tru9I >< Plel >< Bcgl/a X TaqI 

X Msel x Ddel X Nlalll X Bbvl 

>< Eco57I >< BfrI >< Hinfl X Msel >< Maelll X Afal Fnu4HI >< 
TTCTTTAACA ACTATCTTAG GAAAAGAGTC ATGTTTAATG GAGTTACATT TAGTACCTTC GAGGAGGCTG 

9670 9680 9690 9700 9710 9720 9730 


>< Rsal 

>< Csp6I x Rsal 

x Bcgl X Csp6I >< BsmAI 

FIGURE 13.22 
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>< Afal >< Afal >< Alw26I 

CTTTGTGTAC CTTTTTGCTC AACAAGGAAA TGTACCTAAA ATTGCGTAGC GAGACACTGT TGCCACTTAC 

9740 9750 9760 9770 9780 9790 9800 


>< NlalV 


ACAGTATAAC AGGTATCTTG CTCTATATAA 
9810 9820 9830 


>< Rsal 
>< Csp6I 
X Afal 

CAAGTACAAG TATTTCAGTG 
9840 9850 


>< Ddel 
>< BscBI 

>< BfrI Alul >< 
GAGCCTTAGA TACTACCAGC 
9860 9870 


>< Fnu4HI 


>< Ddel 

>< Fnu4HI X BfrI 

X Bbvl X Alul x Bbvl X Ddel X AlwNI 

TATCGTGAAG CAGCTTGCTG CCACTTAGCA AAGGCTCTAA ATGACTTTAG CAACTCAGGT GCTGATGTTC 

9880 9890 9900 9910 9920 9930 9940 


x Sfcl x Bsral 

X PstI X BscCI 

TCTACCAACC ACCACAGACA TCAATCACTT CTGCTGTTCT GCAGAGTGGT TTTAGGAAAA TGGCATTCCC 

9950 9960 9970 9980 9990 10000 10010 


X Rsal 
x Nlalll 

x Maelll 

X Csp6I X Tru9I 

X Afal x Msel 

GTCAGGCAAA GTTGAAGGGT GCATGGTACA AGTAACCTGT GGAACTACAA CTCTTAATGG ATTGTGGTTG 

10020 10030 10040 10050 10060 10070 10080 


x Fokl. 
x Bstll07I 
X AccI 


X 


X NspI 
X NspHI 
X Nlalll 
Afiiri 


>< Tru9I 
X NspI 
X NspHI 
x Nlalll 
x Msel 
X MboII 
> < Bbsl 


XhoII 
Sau3AI 
Ndell 
Mf II 
Mbol 
DpnII 
BstYI 
BspAI 
Bglll 


X 

X 

X 

X 

X 

X 

X 

X 

X 


GATGACACAG TATACTGTCC AAGACATGTC ATTTGCACAG CAGAAGACAT GCTTAATCCT AACTATGAAG 

10090 10100 10110 10120 10130 10140 10150 


Pall > 
Msel > 
Haelll > 
Eael X 


BsuRI > 

>< Dpnl x MboII BshI > 

x Bspl43I x Alul Ball > 

ATCTGCTCAT TCGCAAATCC AACCATAGCT TTCTTGTTCA GGCTGGCAAT GTTCAACTTC GTGTTATTGG 

10160 10170 10180 10190 10200 10210 10220 


x Ddel> < Tru9I 

X Bfrl> < Msel x Ddel 

CCATTCTATG CAAAATTGTC TGCTTAGGCT TAAAGTTGAT ACTTCTAACC CTAAGACACC CAAGTATAAA 

10230 10240 10250 10260 10270 10280 10290 

X ScrFI 
>< Mval 
X EcoRII 

X Ecll36I X SphI 

FIGURE 13.2 3 
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>< Dsav 



>< Pael 

X BstOI 



>< NspI 

>< BstNI 



>< NspHI 

>< BsiLI 


>< Rmal 

>< Nlalll 

>< Apyl 


>< Mael 

>< HphI 

TTTGTCCGTA TCCAACCTGG TCAAACATTT 

TCAGTTCTAG CATGCTACAA TGGTTCACCA TCTGGTGTTT 

10300 10310 10320 


10330 

10340 10350 10360 




>< Sau3AI 

X NdelI 

X MboIX Nlalll 

>< Eco31I 



>< DpnII 

>< BsmAI 



>< Tru9I>< Dpnl 

>< BsalX Nlalll 

>< 

Tru9I 

>< Msel >< Bspl43I 

>< Alw26I 

>< 

Msel 

>< BspAlx Alwl 


ATCAGTGTGC CATGAGACCT AATCATACCA TTAAAGGTTC TTTCCTTAAT GGATCATGTG GTAGTGTTGG 

10370 10380 10390 10400 10410 10420 10430 


>< Zsp2I 
>< PpulOI 

>< Nsilx SfaNI 
>< Ndel 

>< Mphll03I Rsal >< 

>< Tru9I X EcoT22I Csp6I >< 

>< Msel > < Avalll >< Alul Afal >< 

TTTTAACATT GATTATGATT GCGTGTCTTT CTGCTATATG CATCATATGG AGCTTCCAAC AGGAGTACAC 

10440 10450 10460 10470 10480 10490 10500 


x SinI 
>< Sau96I 
>< NspIV 

>< NspHII >< Sfcl 


>< Eco47I 
>< Cfrl3I 
>< BsiZI 


Rsal >< 
PstI >< 

>< Fnu4HI 


>< Rsal 


>< Bmel8I >< Hindi! 


Csp6I >< 


>< Csp6I>< Ddel >< Avail x Hindi >< BspWI 

X AfalX BfrI X AsuIX Bsgl X Bbvl >< BspMI Afal >< 

GCTGGTACTG ACTTAGAAGG TAAATTCTAT GGTCCATTTG TTGACAGACA AACTGCACAG GCTGCAGGTA 

10510 10520 10530 10540 10550 10560 10570 


>< Tru9I >< Nlalll 

>< Msel >< Bbvl >< Fnu4HI HphI >< 

CAGACACAAC CATAACATTA AATGTTTTGG CATGGCTGTA TGCTGCTGTT ATCAATGGTG ATAGGTGGTT 

10580 10590 10600 10610 10620 10630 10640 


>< Tru9I 

X Tfil 

>< Msel >< Rsal 

>< HphI x Tru9I >< Csp6I 

>< Hinfl >< Msel >< Afal 

TCTTAATAGA TTCACCACTA CTTTGAATGA CTTTAACCTT GTGGCAATGA AGTACAACTA TGAACCTTTG 
10650 10660 10670 10680 10690 10700 10710 

X SinI 
>< Sau96I 
x Pssl 
>< Psp5II 
>< PpuMI 
X NspIV 
>< NspHII 
>< NlalV 

FIGURE 13. 24 
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>< Eco0109l 
>< Eco47I 


>< Sau3AI 
>< Ndell 
>< MboX 


X Drall 
X Cfrl3I 
>< BsiZX 


>< Dpnlix NlaXII x BscBI 


X Dpnl >< 

Hindll 

>< 

Brael8I 


>< 

Ddel 

X BspAI >< 

HincII 

>< 

Avail 


>< 

BfrI 

X Bspl431 


X 

Asul 

x Mnll 

>< 

Bbvl 


ACACAAGATC ATGTTGACAT ATTGGGACCT CTTTCTGCTC AAACAGGAAT TGCCGTCTTA GATATGTGTG 

10720 10730 10740 10750 10760 10770 10780 


X Styl 
x Rsal 

X EcoT14I 
X Ecol30I 

x Sfcl > < Csp6I 

X Fnu4HI X Fnu4HI X BssTlI 

X Bbvl >< Fnu4HI X BsaJI 


X Bbvl X Alul 

x PstI 

>< 

Afal 



CTGCTTTGAA AGAGCTGCTG 

CAGAATGGTA 

TGAATGGTCG TACTATCCTT 

GGTAGCACTA 

TTTTAGAAGA 

10790 10800 

10810 

10820 

10830 

10840 

10850 




>< 

Styl 





>< 

ECOT14I 





>< 

Ecol30I 





>< 

BssTlI 


x MboII 


> < Maelllx 

BsaJI 


TGAGTTTACA CCATTTGATG 

TTGTTAGACA 

ATGCTCTGGT GTTACCTTCC 

AAGGTAAGTT 

CAAGAAAATT 

10860 10870 

10880 

10890 

10900 

10910 

10920 

x SfaNI 






> < Sdul 






> < NspII 

X Tru9I 



Rsal X 

X Tru9X> < Bspl-2861 

X Msel 


>< Tfil Csp6I x 

X Msel > < Bmyl 


X FokI 


X Hinfl 

Afal X 

GTTAAGGGCA CTCATCATTG 

GATGCTTTTA 

ACTTTCTTGA CATCACTATT 

GATTCTTGTT 

CAAAGTACAC 

10930 10940 

10950 

10960 

10970 

10980 

10990 



x XmnI 



X Muni 



x BsmI 



Fnu4 HI > 



x BscCI 



BspWI X 

X Maelll 


x Asp700I 


X Bbvl Bbvl > 

AGTGGTCACT GTTTTTCTTT 

GTTTACGAGA 

ATGCTTTCTT GCCATTTACT 

CTTGGTATTA 

TGGCAATTGC 

11000 11010 

11020 

11030 

11040 

11050 

11060 

x NspI 
>< NspHI 

X Tru9I 





X Nlalll 

X Msel 

>< BsmI 




>< BspWI x Fnu4HI>< BspWI 

x BscCI 


X Maelll 

TGCATGTGCT ATGCTGCTTG 

TTAAGCATAA 

GCACGCATTC TTGTGCTTGT 

TTCTGTTACC 

TTCTCTTGCA 

11070 11080 

11090 

11100 

11110 

11120 

11130 



x SfaNI 
x Rmal 





> 

< NspI 

>< 

Mam I 



> 

< Nlalll 


x HphI 




X Nhel 


>< BspHI 


x Tru9I 

x Mael 

>< 

BsiBI 

X Nlalll 

>< BspWI >< Msel 

x Accl> 

< NspHIX Alul 

>< 

BsaBI X Nlalll 

ACAGTTGCTT ACTTTAATAT 

GGTCTACATG 

CCTGCTAGCT GGGTGATGCG 

TATCATGACA 

TGGCTTGAAT 

11140 11150 

11160 

11170 

11180 

11190 

11200 



FIGURE 13.25 
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>< Tru9I 
>< Msel 

> < Rmal > < Esp4I 

> < Mael >< Eco57I 

>< Alul > < Aflll >< Alul 

TGGCTGACAC tagcttgtct ggttataggc ttaaggattg tgttatgtat gcttcagctt tagttttgct 

11210 11220 11230 11240 11250 11260 11270 

>< Rmal 

>< MaelI 
>< Mael 

> < Nlalll >< SfaNI >< Fnu4HI 

X BspHI >< Alul X Bbvl X AfUII 

TATTCTCATG ACAGCTCGCA CTGTTTATGA TGATGCTGCT AGACGTGTTT GGACACTGAT GAATGTCATT 

11280 11290 11300 11310 11320 11330 11340 


>< Sau3AI 
x Ndell 
x Mbol 
x DpnII 


>< Sau961 
>< Pall 
>< NspIV 
>< Nlalll 

>< Haelll 
> < DdeI 
x Cfrl3I 
X BsuRI 
X BsiZI 


>< DprvI >< BshI 

X Bspl43I > < BfrI 

x AccI x BspAIX ALul >< Asul 

ACACTTGTTT ACAAAGTCTA CTATGGTAAT GCTTTAGATC AAGCTATTTC CATGTGGGCC TTAGTTATTT 

11350 11360 11370 11380 11390 11400 11410 


>< Rmal 
x Nlalll 

X Maelx Sfcl 

x MaeXII >< Mnll >< Maelll x Alulx Alul 

CTGTAACCTC TAACTATTCT GGTGTCGTTA CGACTATCAT GTTTTTAGCT AGAGCTATAG TGTTTGTGTG 

11420 11430 11440 11450 11460 11470 11480 


Dde I > 

>< BsrX X Nlalll BfrI > 

TGTTGAGTAT TACCCATTGT TATTTATTAC TGGCAACACC TTACAGTGTA TCATGCTTGT TTATTGTTTC 

11490 11500 11510 11520 11530 11540 11550 


X Pall 
x Haelll 

x Fnu4HI >< BsuRI 
X Bbvl X Fnu4HI >< BspWI 

X Bbvl >< BspWI X BshI X Eco57I >< Maelll 

TTAGGCTATT GTTGCTGCTG CTACTTTGGC CTTTTCTGTT TACTCAACCG TTACTTCAGG CTTACTCTTG 

11560 11570 11580 11590 11600 11610 11620 


>< ScrFl 
>< Mval 
>< EcoRII 

X Ecll36I 
>< DsaV 

>< BstOI 
X BstNI 


>< 

Eco31I 

x BsiLI 

X 

BsmAI 

> < BsaJI 

>< 

Bsal 

>< BsaJI 


FIGURE 13.26 
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>< DrdI >< Alw26I >< Apyl Ddel >< 

GTGTTTATGA CTACTTGGTC TCTACACAAG AATTTAGGTA TATGAACTCC CAGGGGCTTT TGCCTCCTAA 

11630 11640 11650 11660 11670 11680 11690 

>< Tru9I 
>< Msel 

> < HindIII> < Tru9I 

>< Alul > < Msel > < Mall > < Nlalll 

GATGCTTTCA AGCTTAACAT TAAGTTGTTG GGTATTGGAG GTAAACCATG TATCAAGGTT 

11710 11720 11730 11740 11750 11760 

>< Vnel 
>< Snol 

X Sdul 
>< NspII 
>< HgiAI 
X Bspl286I 
X Bmyl X Rsal 
X Rsal >< ApaLI X MboXI 

X Csp6I >< Alw441 x Csp6I Ddel > 

>< Afal >< MaeII x Alw21I X Afal BfrX > 

GCTACTGTAC AGTCTAAAAT GTCTGACGTA AAGTGCACAT CTGTGGTACT GCTCTCGGTT CTTCAACAAC 

11770 11780 11790 11800 11810 11820 11830 

x NspII> < Rsal 
X Drain 
X SduIX Csp6I 

X MboII >< Bspl286I 

X Hinfl X Plel X Bmyl > < Afal >< MboII 

TTAGAGTAGA GTCATCTTCT AAATTGTGGG CACAATGTGT ACAACTCCAC AATGATATTC TTCTTGCAAA 

11840 11850 11860 11870 11880 11890 11900 


X SfaNI 
>< Mnll 
GAGTAGTATT 
11700 


X TthHB8 I 

>< TaqI Sfcl X 

x Hindlll x MboII x Nlalll 

x Alul > < Eco57I X BspWI AccI X 

AGACACAACT GAAGCTTTCG AGAAGATGGT TTCTCTTTTG TCTGTTTTGC TATCCATGCA GGGTGCTGTA 

11910 11920 11930 11940 11950 11960 11970 


>< VspI 

>< Tru9I > < Ksp632I 

>< Msel X TthHB8I > < Earl 

>< Asnl X TaqI x MboII > < EamlI04I 

>< Aselx Mnll x Bcgl/a x Eco57I x Eco57I X Bcgl 

GACATTAATA GGTTGTGCGA GGAAATGCTC GATAACCGTG CTACTCTTCA GGCTATTGCT TCAGAATTTA 

11980 11990 12000 12010 12020 12030 12040 


X StuI 
>< ScrFI 

x Pall 

x Mvalx Haelll 
x EcoRIIx Ecol471 
X Ecll36I 
x DsaV X BsuRI 
x BstOI 
X BstNI 

X BspWI 
x BsiLI 

x Fnu4HI x BsaJI x BshI Tfil x 

X Ndel X BspWIX Mnll X Bgll X Sfcl Hinfl x 

X Acil x Apylx Aatl > < Alul 


FIGURE 13. 27 
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GTTCTTT.ACC ATCATATGCC GCTTATGCCA CTGCCCAGGA GGCCTATGAG CAGGCTGTAG CTAATGGTGA 

12050 12060 12070 12080 12090 12100 12110 


X XmnI X Tru9I >< SfaNI 

>< HphI >< Msel >< Ddel 

>< Asp700I >< Eco57I >< Bbvl Fnu4HI X 

TTCTGAAGTC GTTCTCAAAA AGTTAAAGAA ATCTTTGAAT GTGGCTAAAT CTGAGTTTGA CCGTGATGCT 

12120 12130 12140 12150 12160 12170 12180 


> 

> 

> 

> 


>< Nlalll 

GCCATGCAAC GCAAGTTGGA AAAGATGGCA 
12190 12200 12210 


Sau3AI 
Ndell 
Mbol 
Dpnll 
>< Dpnl 
>< BspWI 
< BspAI 
>< Bspl43I 


XhoII X 
Sau3AI X 
Ndell X 

Mali > 
X Mnll 
x Mfll 
x Mbol 
DpnlI >< 

Dpnl >< 
Ddel >< 
BstYI x 
>< RsalBspAI >< 

>< Csp6IBspl43I >< 

X AfaIBglll x 


GATCAGGCTA TGACCCAAAT GTACAAACAG GCAAGATCTG 
12220 12230 12240 12250 


>< Spel 
>< Rmal 
>< Maelll 

>< Mae! 


AGGACAAGAG GGCAAAAGTA ACTAGTGCTA 
12260 12270 12280 


>< Ksp632I > < HinduX 
X Ddel >< SfaNI 

>< MboII X Eamll04I X BspWI 

X BspWI X Earlx BfrI >< Alul 
TGCAAACAAT GCTCTTCACT ATGCTTAGGA AGCTTGATAA 
12290 12300 12310 12320 


>< Thai 
>< MvnI 
>< HinPlI 
>< Hin6I 
>< Hhal 
X Cfol 


X Tru9I 
x Msel 

TGATGCACTT AACAACATTA TCAACAATGC 
12330 12340 12350 


X BstUI 
X Bsp50I 
>< AccII 

GCGTGATGGT TGTGTTCCAC TCAACATCAT 
12360 12370 12380 


Sfcl x 
ACCATTGACT 
12390 


>< Rsal 
X NlalV 
>< Eco64I 
X Csp6I 
X BslI 

>< BsiYIx KpnX 
>< BscBI 
>< BanI 
>< Asp718 

X Nlalll X Afal 

X BstXI >< AccBlI x Maelll 

>< Fnu4HI >< Bbvl >< Acc65I Bsgl >< 

ACAGCAGCCA AACTCATGGT TGTTGTCCCT GATTATGGTA CCTACAAGAA CACTTGTGAT GGTAACACCT 

12400 12410 12420 12430 12440 12450 12460 

X Zsp2I 
X PpulOI 


FIGURE 13.28 
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>< Nsil 
>< Mphll03I 

>< Ndeix EcoT22I Ddel >< 

>< AvalII >< SfaNI >< SfaNI >< Acil BfrI >< 

TTACATATGC ATCTGCACTC TGGGAAATCC AGCAAGTTGT TGATGCGGAT AGCAAGATTG TTCAACTTAG 

12470 12480 12490 12500 12510 12520 12530 

>< Pall 

>< Haelll >< Moll >< DdelDdel >< 

>< Tru9I>< Nlalll >< BsuRI >< Maelll >< BspWI 

>< Mseix HphI > < XcmIX BshI X Alul BspWI X 

TGAAATTAAC ATGGACAATT CACCAAATTT GGCTTGGCCT CTTATTGTTA CAGCTCTAAG AGCCAACTCA 

12540 12550 12560 12570 12580 12590 12600 


Rsal X 
NlalV x 
Kpnl x 
>< Fnu4HI 
Eco64 X >< 


X Tru9I 


Gsp6I x 
BscBI >< 


X PvuII 
x Psp5I 


Asp718 >< 
Afal x 


X NspBII >< Acilx BanI 

x Msel x Hinfl x Plel AccBlI x 

X Alul > < Sfcl X DdeIX BsrI >< PshAI Acc65I >< 

GCTGTTAAAC TACAGAATAA TGAACTGAGT CCAGTAGCAC TACGACAGAT GTCCTGTGCG GCTGGTACCA 

12610 12620 12630 12640 12650 12660 12670 


X TthHB8I 
X TaqI 
X Sful 


x NspV 
x Mnll 
x LspI 
x Csp45I 
X BstBI 


X Rsal 
X Csp6I 
x Alul 

x Afal 


X Bspll9I 
>< BsiCI 
>< Bpul4I 
x AsuII 


CACAAACAGC TTGTACTGAT GACAATGCAC TTGCCTACTA TAACAATTCG AAGGGAGGTA GGTTTGTGCT 

12680 12690 12700 12710 12720 12730 12740 


x XhoII 
X Sau3AI 
x Ndell 
X Mfll 
X Mbol 


>< Dpn.II 
>< Dpnl 

x BstYI x Tfil >< Rsal 


GGCATTACTA TCAGACCACC 
12750 12760 


X BspAI X Rmal 

>< Bspl43I X Hinfl 

x Bglll x MaeI x Ddel 

AAGATCTCAA ATGGGCTAGA TTCCCTAAGA 
12770 12780 12790 


>< Csp6I 
x Csp6I>< Rsal 
>< Afaix Afal 
GTGATGGTAC AGGTACAATT 
12800 12810 


X Sau96I 

>< PssI 
X Pall 
>< NspIV 


FIGURE 13.29 
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x Haeiri 





>< 

Eco01091 





>< 

Drall 





>< 

Cfrl3I 






X BsuRI 



X NlalV 


>< 

BsiZI 

Rsal > 


X BsrI 



X BshI 

Csp6I X 


x BscBI > 

< Maelll 

>< 

Asul 

AfaX > 

TACACAGAAC 

TGGAACCACC TTGTAGGTTT 

GTTACAGACA 

CACCAAAAGG 

GCCTAAAGTG 

AAATACTTGT 

12820 

12830 12840 

12850 

12860 

12870 

12880 


>< Sfcl 
> < MboII 
MaeII >< 


>< Fnu4HI >< Rsal 
>< Eco57l >< Csp6I 



X Tru9I 



> 

< Bbsl 


>< Msel 

x Mnll 


>< Bbvl 

X Alul 

X Afal 

ACTTCATCAA 

AGGCTTAAAC 

AACCTAAATA 

GAGGTATGGT 

GCTGGGCAGT 

TTAGCTGCTA 

CAGTACGTCT 

12890 

12900 

12910 

12920 

12930 

12940 

12950 



x Rsal 






X Sfcl 

>< Csp6I 






X BspWI 

x Afal 

X BspMI 


AccI >< 

TCAGGCTGGA 

AATGCTACAG 

AAGTACCTGC 

CAATTCAACT 

GTGCTTTCCT 

TCTGTGCTTT 

TGCAGTAGAC 

12960 

12970 

12980 

12990 

13000 

13010 

13020 



X Rmal 







X Mnll 






>< Mael 

X 

HphI 



CCTGCTAAAG 

CATATAAGGA 

TTACCTAGCA 

AGTGGAGGAC 

AACCAATCAC 

CAACTGTGTG 

AAGATGTTGT 

13030 

13040 

13050 

13060 

13070 

13080 

13090 


>< SinI 
>< Sau96I 
>< NspIV 
>< NspHII 
>< Nlalll 
>< Eco47I 

>< Eamll05I 
>< Cfr!3I 


>< Rsal 

x Rsal 




X BsiZI 

X MboII 

x Csp6I 




x Bmel8I >< Xcml 

X Csp6I 

x BsrI 




x Avail Plel x 

>< Afal 

>< Afal 


X Maelll 

X Alul 

X Asul> < Hinfl 

GTACACACAC 

TGGTACAGGA 

CAGGCAATTA 

CTGTAACACC 

AGAAGCTAAC 

ATGGACCAAG AGTCCTTTGG 

13100 

13110 

13120 

13130 

13140 

13150 13160 






X Tfil 


X SfaNI 



>< Maelll 


X Nlalll 

X FokI 


x Hinfl 

TGGTGCTTCA 

TGTTGTCTGT 

ATTGTAGATG 

CCACATTGAC 

CATCCAAATC 

CTAAAGGATT CTGTGACTTG 

13170 

13180 

13190 

13200 

13210 

13220 13230 

> 

< Rsal 






>< Maell 





>< 

Csp6I 




x Ddel 

> 

< Afal 



X BsrI 

x BfrI 

AAAGGTAAGT 

ACGTCCAAAT 

ACCTACCACT 

TGTGCTAATG 

ACCCAGTGGG 

TTTTACACTT AGAAACACAG 

13240 

13250 

13260 

13270 

13280 

13290 13300 


>< Thai 


FIGURE 13.30 
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>< SfaNI 
>< MvnI 
>< BstUI 

>< RsaX 
>< Csp6I 
x Afal >< Acil 
TCTGTACCGT CTGCGGAATG 
13310 13320 


>< Bsp50I 
>< Acil 

>< Sfcl >< Maelll >< AccIISfaNI >< 

TGGAAAGGTT ATGGCTGTAG TTGTGACCAA CTCCGCGAAC CCTTGATGCA 
13330 13340 13350 13360 13370 


>< Zsp2I 

> < SfaNI 

>< Mphll03IX Tru9I 
>< PpulOlx Maell 

X Nsil> < FokI 
X EcoT22I X Msel 
X Aciix Avalll X Dral 

GTCTGCGGAT GCATCAACGT TTTTAAACGG 
13380 13390 13400 


Fnu4HI >< 
Bsgl X 
X Bbvl 

X Acil X Fnu4HI Acil X 

GTTTGCGGTG TAAGTGCAGC CCGTCTTACA CCGTGCGGCA 
13410 13420 13430 13440 


X Sfcl X BspWI 

>< AccI X Bcgl/a Bcgl > 

GTCTACAGGG CTTTTGATAT TTACAACGAA AAAGTTGCTG GTTTTGCAAA 
13470 13480 13490 13500 13510 

x ScrFI 
x Mval 

x Mali 
x EcoRII 
x Ecll36I 
X BstOX 
X BstNI 

X BslI 

X DsaV X BsiYI 

X BsiLI x Plel 

X Apyl > < FokI X Hinfl 

GTTCCTAAAA ACTAATTGCT GTCGCTTCCA GGAGAAGGAT GAGGAAGGCA ATTTATTAGA CTCTTACTTT 

13520 13530 13540 13550 13560 13570 13580 


>< Spel 

>< Seal 
x Rsal 
x Rmal 
x Mael 

> < Csp6I 
x BspWI X Afal 
CAGGCACTAG TACTGATGTC 
13450 13460 


X Tru9I 
>< Msel 
x Mali 


x Nlalll 
X Ksp632I 
x Earl 
x Eamll04I 
X BsmAI 
X Alw26I 


X MboII 


X Tru9I 
x Msel 


GTAGTTAAGA GGCATACTAT GTCTAACTAC CAACATGAAG AGACTATTTA TAACTTGGTT AAAGATTGTC 


13590 


13600 


13610 


13620 


13630 


13640 


13650 


X Rsal 
>< NlalV 

> < Nlalll 

x Kpnl 
X HphI 

> < Eco64I 
X Csp6I 

X BscBI 

> < BanI 

> < Asp718 


FIGURE 13.31 
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>< Maelll >< Afal 

>< NspBII > < AccBlI Maell >< 

>< Acil >< Nlalll > < Acc65I > < Hgal 

CAGCGGTTGC TGTCCATGAC TTTTTCAAGT TTAGAGTAGA TGGTGACATG GTACCACATA TATCACGTCA 

13660 13670 13680 13690 13700 13710 13720 


>< Mnll 
>< MaeII 

GCGTCTAACT AAATACACAA TGGCTGATTT AGTCTATGCT CTACGTCATT TTGATGAGGG TAATTGTGAT 

13730 13740 13750 13760 13770 13780 13790 


>< Tru9I 

>< Msel >< Maelll >< Muni 

ACATTAAAAG AAATACTCGT CACATACAAT TGCTGTGATG ATGATTATTT CAATAAGAAG GATTGGTATG 

13800 13810 13820 13830 13840 13850 13860 


X Thai 
>< MvnI 
>< Mlul 


>< BstCJI 


>< Rsal 


>< Bsp50I 

>< Tfil >< AfUII >< Ddel 

>< Hinfl >< AccII >< BfrI 

ACTTCGTAGA GAATCCTGAC ATCTTACGCG TATATGCTAA CTTAGGTGAG 
13870 13880 13890 13900 13910 


>< HphI 

>< Csp6I Tru9I >< 
>< Afal Msel >< 
CGTGTACGCC AATCATTATT 
13920 13930 


XhoII > 
Sau3AI > 
Ndell > 
MfII > 

> < SfaNI 
>< Rsal 
>< Csp6I 
x Afal 

AAAGACTGTA CAATTCTGCG 
13940 13950 




>< 

Rsal 

Mbol > 



> < 

Csp6I 

DpnII > 



>< BspWI 


BstYI > 

x SfaNI 


>< 

Afal 

BspAI > 

ATGCTATGCG 

TGATGCAGGC 

ATTGTAGGCG TACTGACATT 

AGATAATCAG 

13960 

13970 

13980 

13990 

14000 


> < ScrFI 

> < Mval 


>< Fnu4 HI 
>< EcoRII 

> < EcL136I 

> < BstOI 

> < BstNI 

>< Tru9I >< Rsal >< BslI 


>< Msel 
>< Dpnl 
>< Bspl43I 

x Alwl 


X Rsal 
x Csp6l 
x BsrI 
x Afal 


> < HphI 
x Csp6I 

> < Bbvl 
x Afal 


x BsiYI 

> < BsiLI 

> < Apyl 

X DsaV x Acil 


GATCTTAATG GGAACTGGTA CGATTTCGGT GATTTCGTAC AAGTAGCACC AGGCTGCGGA GTTCCTATTG 

14010 14020 14030 14040 14050 14060 14070 


x MamI 

X Tfil >< SfaNI X BsiBI 

X Hinfl x FokI x BsaBI 

TGGATTCATA TTACTCATTG CTGATGCCCA TCCTCACTTT 
14080 14090 14100 14110 


X SfaNI 

>< RmaX > < Hinfl 

x Mnll x Fnu4HIPleI >< 


X Mael x Ddel 

>< Bbvl x BspWI Ndel >< 

GACTAGGGCA TTGGCTGCTG AGTCCCATAT 
14120 14130 14140 


X Sau3AI 
X NdelI 


FIGURE 13.32 
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>< Mbol 




>< MamI 




>< DpnII 



Tthllll X 

>< Dpnl 



MboII >< 

>< BspWI 


>< 

Ksp632I 

>< BspAI 


>< 

Eamll04I 

X Bspl431 

>< Xcml 


>< BsmAI 

>< BsiBI 

>< Tru9l 

>< 

Earl AspI >< 

>< BsaBI >< FokI 

X Msel 


x Alw26I 


GGATGCTGAT CTCGCAAAAC CACTTATTAA GTGGGATTTG CTGAAATATG ATTTTACGGA AGAGAGACTT 


14150 14160 

14170 

14180 

14190 

14200 

14210 


> 

< SinI 





> 

< Sau96I 





> 

< NspIV 






>< NspHII 




X TthHB8I 


x NlalV 




>< TaqI 

>< 

FokI 




X Mcrl 

> 

< Eco47I 




> < Ksp632I 

> 

< Cfrl3I 




> < Earl 

> 

< BsiZI 




> < Eamll04I 

X SspIX BscBI 




X BsmAI > 

< Tru9I > 

< Bmel8I 




x MboII X BsiEI> 

< Msel > 

< Avail 


>< Tru9I 


X Alw26l 

X. Dral > 

< Asul 

x Muni >< Msel 


TGTCTCTTCG ACCGTTATTT 

TAAATATTGG 

GACCAGACAT 

ACCATCCCAA 

TTGTATTAAC TGTTTGGATG 

14220 14230 

14240 

14250 

14260 

14270 

14280 


X Tru9I 

>< FokI >< MseX 

ATAGGTGTAT CCTTCATTGT GCAAACTTTA ATGTGTTATT 
14290 14300 14310 14320 


SinI >< 
Sau96I >< 
NspIV >< 
NspHII > 
Eco47I >< 
Cfrl3I X 
BsiZI >< 
Bmel8I >< 
Avail >< 
Asul >< 

TTCTACTGTG TTTCCACCTA CAAGTTTTGG 
14330 14340 14350 


x Spel 
>< Rmal 

>< Mael >< SspI >< BsrI 

ACCACTAGTA AGAAAAATAT TTGTAGATGG TGTTCCTTTT GTTGTTTCAA CTGGATACCA TTTTCGTGAG 

14360 14370 14380 14390 14400 14410 14420 


X ThalX Esp3I 
>< Ddel 
>< Bstur 

x Rsal >< Bsp50I >< BsmBI 

>< Hinfl >< Plel x Mvnlx BsmAI 

> < Csp6I x Hgalx Alul X Alw26I 

>< Afal >< FokI >< AccII > < Bbvl 

TTAGGAGTCG TACATAATCA GGATGTAAAC TTACATAGCT CGCGTCTCAG TTTCAAGGAA CTTTTAGTGT 

14430 14440 14450 14460 14470 14480 14490 

X Zsp2I 
X SphI 
X PpulOI 

>< Pael 
>< NspI 


FIGURE 13.33 
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>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 

> < Dpnl 

>< Fnu4HIx BspWI 
>< BspAI 

> < Bspl43I> 

>< Alwl >< Alul 


>< NspHI 
>< Nsil 
X Nlalll 
X Mphll03I 
X Fnu4HI 
X EcoT22I 
X BspWI 

< AvalII > < AlwNI 

X Alul x Bbvl 


X Rmal 
X Mael 


X NspI 
NspHI >< 
Nlalll >< 

X BspWI 
x Bsgl 
>< Bbvl 


ATGCTGCTGA TCCAGCTATG CATGCAGCTT CTGGCAATTT ATTGCTAGAT AAACGCACTA CATGCTTTTC 


14500 


14510 


14520 


14530 


14540 


14550 


14560 


X ScrFI 
X Neil 
X MspI 
X Hpall 

X Fnu4 HI >< Hap11 

X AlwNI >< DsaV X Tru9I 

X Alul >< Bcnl X Msel 

AGTAGCTGCA CTAACAAACA ATGTTGCTTT TCAAACTGTC AAACCCGGTA ATTTTAATAA AGACTTTTAT 

14570 14580 14590 14600 14610 14620 14630 

x Tru9I Ddel >< 

X Msel X MboII Bbvl X 

GACTTTGCTG TGTCTAAAGG TTTCTTTAAG GAAGGAAGTT CTGTTGAACT AAAACACTTC TTCTTTGCTC 

14640 14650 14660 14670 14680 14690 14700 

>< FokI EcoRV X 

x Frui4HI Eco32I X 

AGGATGGCAA CGCTGCTATC AGTGATTATG ACTATTATCG TTATAATCTG CCAACAATGT GTGATATCAG 

14710 14720 14730 14740 14750 14760 14770 

X VspI 
>< Tru9I 
X Msel 
X Asnl 

X Maelll X Asel 

ACAACTCCTA TTCGTAGTTG AAGTTGTTGA TAAATACTTT GATTGTTACG ATGGTGGCTG TATTAATGCC 

14780 14790 14800 14810 14820 14830 14840 


X Tru9I 
>< Msel 
X Hpal 
>< Hindu 
X Hindi 


x PvuII 
x Psp5I 
x NspBII 
x Alul 


> < Xcml 
x Tru9I 
X Msel 


Rmal X 
Mael X 


AACCAAGTAA TCGTTAACAA TCTGGATAAA TCAGCTGGTT TCCCATTTAA TAAATGGGGT AAGGCTAGAC 


14850 


14860 


14870 


14880 


14890 


14900 


14910 


X SfaNI 

X Sau3AI 
X Ndell 
x Mbol 
X DpnII 
X Dpnl 

X Plel X Bspl43I 

X HinfIX Mnll >< BspAI X Alwl 
TTTATTATGA CTCAATGAGT TATGAGGATC AAGATGCACT 
14920 14930 14940 14950 


x Thai 
x MvnI 
X BstUI 

X Bstll07I 
X BspWI X FokI 
X Bsp50I 
X AccIIX Ddel 
x AccI 

TTTCGCGTAT ACTAAGCGTA ATGTCATCCC 
14960 14970 14980 


X SstI 
x Sdul 
x SacI 


FIGURE 13.34 
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>< Tru9I > 

>< Tfil 

>< Msel 
>< Hinfl 

> < Esp4I 

> < Aflll >< BspWI > 

TACTATAACT CAAATGAATC TTAAGTATGC CATTAGTGCA AAGAATAGAG 

14990 15000 15010 15020 15030 


>< NspII 
X HgiAI 
>< Eco24I 

< EC1136II 
X Bspl286I 
>< Bmyl 

>< BanIX 
X Alw21I 

< Alul >< Alul 

CTCGCACCGT AGCTGGTGTC 

15040 15050 


x Seal 


Rmal >< 
> < Mnll 


>< SfeIX Rsal 


Mae! >< 


X BsmAI X Csp6I X Fnu4HI 

>< Alw26I x Afal X Acil 

TCTATCTGTA GTACTATGAC AAATAGACAG TTTCATCAGA AATTATTGAA GTCAATAGCC GCCACTAGAG 

15060 15070 15080 15090 15100 15110 15120 


>< Alul 
GAGCTACTGT 
15130 


GGTAATTGGA 

ACAAGCAAGT 

TTTACGGTGG 

CTGGCATAAT 

X Tru9I 

X Msel 

ATGTTAAAAA CTGTTTACAG 

15140 

15150 

15160 

15170 

15180 15190 


NspI X 
NspHI X 
Nlalll >< 
X Nlalll 

Ddel X 
BspWI X 

X Maelll BfrI X 


TGATGTAGAA 

ACTCCACACC 

TTATGGGTTG 

GGATTATCCA 

AAATGTGACA 

GAGCCATGCC 

TAACATGCTT 

15200 


15210 

15220 

15230 

15240 

15250 

15260 

> 

< 

Pall 






> 

< 

HaelXI 






> 

< 

BsuRI 






> 

< 

BshI 

x Mnll 


X Maelll 

Sfcl X 

AGGATAATGG 

CCTCTCTTGT 

TCTTGCTCGC 

AAACATAACA 

CTTGCTGTAA 

CTTATCACAC 

CGTTTCTACA 

15270 


15280 

15290 

15300 

15310 

15320 

15330 







Tru9I X 








ScrFI > 








Mval > 








>< Msel 



X 

MstI 




FokI X 



X 1 

HinPlI 




EcoRII X 



X 1 

Hin6I 




Ecll36I > 



> 

< Hhal 




DsaV X 



X 

FspI 




BstOI > 



X 

Fdill 


X Nlalll 

BstNI > 



> 

< CfoIX Tru9I 

> 

< Fnu4HI 

BsiLI > 

X Alul 

X 

Avill X Msel 

X 

Acil 

Apyl > 

GGTTAGCTAA 

CGAGTGTGCG 

CAAGTATTAA 

GTGAGATGGT 

CATGTGTGGC 

GGCTCACTAT 

ATGTTAAACC 

15340 


15350 

15360 

15370 

15380 

15390 

15400 

> 

< 

SEaNI 








X MspI 







X Hpall X 

HphI 


x Tru9I Maelll x 



x HapII x 

BspWI 


>< Msel Alul X 
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aggtggaaca tcatccggtg atgctacaac tgcttatgct aatagtgtct ttaacatttg tcaagctgtt 

15410 15420 15430 15440 15450 15460 15470 

>< DrdI 

>< BspWI X Alul > c'Acil 

acagccaatg taaatgcact tctttcaact gatggtaata agatagctga caagtatgtc cgcaatctac 

15480 15490 15500 15510 15520 15530 15540 


x Sau3AI 
>< Ndell 
>< Mbol 
> < MamI 

X Fbal 


>< Sfcl > 

X BsraAI > 

>< Alw26I 

aacacaggct ctatgagtgt ctctatagaa atagggatgt 

15550 15560 15570 15580 


X DpnII 
X Dpnl 
X BspHI 
X BspAI 
>< Bspl43I 
x BsiQI 

< BsiBIx Nlalll 

< BsaBIX FokI 

>< BclIX EcoRI FokI >< 

tgatcatgaa ttcgtggatg agttttacgc 

15590 15600 15610 


X Tfil 

>< SfaNI 
>< Nlalll 

x BspMI x Hinfl >< Maelll 

TTACCTGCGT AAACATTTCT CCATGATGAT TCTTTCTGAT GATGCCGTTG TGTGCTATAA CAGTAACTAT 

15620 15630 15640 15650 15660 15670 15680 


> < Rina I 

x Nhel x Tru9I 

>< Fnu4HI > < MaeI x Tru9I 

X Acil >< Alul >< Msel >< Msel Mnll X 

GCGGCTCAAG GTTTAGTAGC TAGCATTAAG AACTTTAAGG CAGTTCTTTA TTATCAAAAT AATGTGTTCA 

15690 15700 15710 15720 15730 15740 15750 


>< SinI 
>< Sau96I 
>< PssI 
x PspSII 
>< PpuMI 
>< NspIV 
X NspHII 
>< EcoO109I 
>< Eco4 71 
>< Drall 
>< Cfrl3I 
x BsiZI 



>< DdeI 


>< Bmel8I 


>< Nlalll 

>< BsraAI 


>< Avail 


>< Ddel 

>< Alw26I 


>< Asul 

X Mnll 

TGTCTGAGGC 

AAAATGTTGG ACTGAGACTG 

ACCTTACTAA 

AGGACCTCAC GAATTTTGCT CACAGCATAC 

15760 

15770 15780 

15790 

15800 

15810 15820 




x XhoII 
>< Sau3AI 
>< Ndell 
>< Mf 11 
>< Mbol 



FIGURE 13. 36 
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>< Tru9I 
>< RmaX 
X Mael 

X BspHIX Msel 


>< Rsal 
>< MaelI 

>< Csp6I 
X BsaAI 
X AfIIII 

>< Afal 


X DpnII 
X Dpnl 
X BstYI 
X BspMI 

>< BspAI 

X AIwIX Bspl4 31 


> < SspI 
HinPlI X 
Hin6I >< 
Hhal X 
Cfol >< 


aatgctagtt aaacaaggag atgattacgt gtacctgcct tacccagatc catcaagaat attaggcgca 

15830 15840 15850 15860 15870 15880 15890 


x Rsal >< SfaNI 

x TthHB8I x Csp6I x Maelll 

x TaqI x Afal BsrI X 

ggctgttttg tcgatgatat tgtcaaaaca gatggtacac ttatgattga aaggttcgtg tcactggcta 

15900 15910 15920 15930 15940 15950 15960 

> < FokI 
X BspWI 

TTGATGCTTA CCCACTTACA AAACATCCTA ATCAGGAGTA TGCTGATGTC TTTCACTTGT ATTTACAATA 

15970 15980 15990 16000 16010 16020 16030 

>< Van91I 
X PflMI 
X NspI 

> < PallX NspHI 

> < MscIX Nlalll 

> < Haelll 

> < BsuRI 
x BsrI 

X Eael >< BslI X NspI 

> < BshlX BsiYI X NspHI 

x Nlalll x AfUII x Af II11 

x Maelll >< Alul > < Balix AccB7l x Nlalll 

CATTAGAAAG ttacatgatg agcttactgg ccacatgttg GACATGTATT CCGTAATGCT aactaatgat 

16040 16050 16060 16070 16080 16090 16100 

X Rsal> < NlalV 

x Mnll 

X Csp6I X Ddel x Rsal 

x BsrI x Mnll X Csp6I 

X Afal> < BscBI X Afal Sfcl x 

AACACCTCAC GGTACTGGGA ACCTGAGTTT TATGAGGCTA TGTACACACC ACATACAGTC TTGCAGGCTG 

16110 16120 16130 16140 16150 16160 16170 


X BspWI 


x NlalV 

>< EcoNI 
x Eco31I 
X Eco64I>< BsmAI 
x BscBI x BslI 
x BanI x BsiYI 
>< Acil x Bsal 

X AccBlIX Alw26I Bbvl X 


taggtgcttg tgtattgtgc aattcacaga cttcacttcg ttgcggtgcc tgtattagga gaccattcct 


x Tthllll 

X Fnu4HI X Nlalll > C Tru9I 

X BspWI >< AspI > < Msel 

ATGTTGCAAG TGCTGCTATG ACCATGTCAT TTCAACATCA CACAAATTAG TGTTGTCTGT TAATCCCTAT 

16250 16260 16270 16280 16290 16300 16310 

x ScrFI 
>< Mval 


FIGURE 13.37 


253 



EP 1 694 829 B1 


X EcoRII 
>< Ecll36I 
>< DsaV 
>< BstOI 
>< BstNI 

>< BsiLI >< Rmal 

X BsaJI x Mnll BspWI >< 

>< Apyl x Maelll >< Maelll >< Mael >< Alul 

GTTTGCAATG CCCCAGGTTG TGATGTCACT GATGTGACAC AACTGTATCT AGGAGGTATG AGCTATTATT 

16320 16330 16340 16350 16360 16370 16380 


X Maelll X Mnll 

GCAAGTCACA TAAGCCTCCC ATTAGTTTTC CATTATGTGC TAATGGTCAG. GTTTTTGGTT TATACAAAAA 

16390 16400 16410 16420 16430 16440 16450 

X NspI >< NspI 

X NspHI > < Tthllll X NspHI 

x Nlallix Maellix Maelll >< Nlalll 

>< Af 1III X Asp I x Afllll 

CACATGTGTA GGCAGTGACA ATGTCACTGA CTTCAATGCG ATAGCAACAT GTGATTGGAC TAATGCTGGC 

16460 16470 16480 16490 16500 16510 16520 


x Rsal 
x Plel 
x Ddel 
>< Csp6I 

x BsmAI >< Hinfl x Mali 

x Alw26I >< Hinctlll Ddel x 

x Afal >< Alul x Fnu4HI x Bbvl 

GATTACATAC TTGCCAACAC TTGTACTGAG AGACTCAAGC TTTTCGCAGC AGAAACGCTC AAAGCCACTG 

16530 16540 16550 16560 16570 16580 16590 


> < Thai 
x Seal 

>< Rsal >< Rsal 

> < MvnI 

X Csp6I >< Csp6I 

> < BstUI 

> < BspSOI 

< Ndel X Afal >< Afal 

> < AccII Mnll > 

TATGGTATTG CCACTGTACG CGAAGTACTC TCTGACAGAG AATTGCATCT 

. 16620 16630 16640 16650 16660 

Maelll >< 
x Maelll 
X Eco0651 
X Eco91I 
X BstPI 

>< SfaNI X Rmal X BstEII 

>< Nlalll x Mael x BsrI 

TTCATGGGAG GTTGGAAAAC CTAGACCACC ATTGAACAGA AACTATGTCT TTACTGGTTA CCGTGTAACT 

16670 16680 16690 16700 16710 16720 16730 

Rsal X 
X Mnll 

>< Rsal x Rsal >< HphI 

x Csp6I x Csp6I x SfaNI Csp6I x 

>< Afal x Afal x Maelll >< HphI Afal X 

AAAAATAGTA AAGTACAGAT TGGAGAGTAC ACCTTTGAAA AAGGTGACTA TGGTGATGCT GTTGTGTACA 

16740 16750 16760 16770 16780 16790 16800 


> < Tru9I 

> < Msel > 

>< Alul 

AGGAAACATT TAAGCTGTCA 
16600 16610 


FIGURE 13. 38 
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>< Rsal 
X Csp6I 
>< Afal 

GAGGTACTAC GACATACAAG TTGAATGTTG 
16810 16820 16830 


>< HphI 

X Hindll 
>< Hindi 

GTGATTACTT TGTGTTGACA TCTCACACTG 
16840 16850 16860 


Ddel >< 
BfrI >< 
TAATGCCACT 
16870 


X Vnel 
X Snol 

X Sdul 
x NspII 
X HgiAI 
x Drain 

X Bspl286I 
X Bmyl 

X ApaLI X Rmal 

X Alw44I X MaeI 

x Alw21I 

TAGTGCACCT ACTCTAGTGC 
16880 16890 


< 

< 

< 


X 


Sdul 
NspII 
HgiAI 
>< Drain 
Bspl28 61 

Bmyl X 

Alw21I 

CACAAGAGCA CTATGTGAGA ATTACTGGCT 
16900 16910 16920 


> 

> 

> 

BspWI 
> < 
> < 
> < 


X Rsal 
X Csp6I 
BsrI 

x Afal Ddel > 

TGTACCCAAC ACTCAACATC 
16930 16940 


Sty I X 

SinI > 
Sau96I > 
NspIV > 
ECOT14I x 

Eco4 71 > 
Ecol30I X 
X Seal Ofrl3I > 
BssTlI >< 



>< 

SphI x 

Rsal BsiZI 

> 


>< 

Pael 

BsaJI x 



>< 

Nlalll 

BmelSI 

> 

x Rmal 

>< 

NspIX 

Csp6I Avail 

> 

x Mae I 

>< 

NspHIX 

Afal Asul 

> 


TCAGATGAGT TTTCTAGCAA TGTTGCAAAT TATCAAAAGG TCGGCATGCA AAAGTACTCT ACACTCCAAG 

16950 16960 16970 16980 16990 17000 17010 


>< ScrEI 

x Rsal 
>< Mval 
>< EcoRII 
X Ecll36I 
> < Csp6I 
>< BstOI 
>< BstNI 

X Xcml X BslI 

X NspHII X BsiYI 

>< BsiLI 

>< Apyl x BsrI 
>< DsaVX Afal > < Hinfix Plel 

GACCACCTGG TACTGGTAAG AGTCATTTTG CCATCGGACT TGCTCTCTAT TACCCATCTG CTCGCATAGT 

17020 17030 17040 17050 ' 17060 17070 17080 

x SfaNI 

X SphI X PvuII 

x Pael >< PspSI 

x NspI >< NspBII 

X NspHI x Fnu4HI > < Tru9I 

>< Bstll07I > < NlalllX BspWI X SspI 

x AccI x Nlalll >< Alul >< Bbvl > < Msel 

GTATACGGCA TGCTCTCATG CAGCTGTTGA TGCCCTATGT GAAAAGGCAT TAAAATATTT GCCCATAGAT 

17090 17100 17110 17120 17130 17140 17150 

FIGURE 13.39 
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> < Thai 
>< Thai 

> < MvnI 

x MvnI >< Thai 

> < HinPlI 
>< HinPlI 

>< HinPlI >< MvnI 

> < Hin6I 
>< Hin6I 

> < Hhal 

X Hhal >< Hhal 

> < Cfol 

>< Cfol >< Cfol 

> < BstUI 
>< BstUI >< BstUI 

>< BssHII 
>< BspMI 

> < Bsp50I 




X BspSOIX Bsp50I 



Rmal > 


X Tfil 

>< Hin6I> < AccII 



Mael > 


>< Hinfl 

X AccII X AccII 


> 

< EcoRI 

AAATGTAGTA 

GAATCATACC 

TGCGCGTGCG CGCGTAGAGT 

GTTTTGATAA 

ATTCAAAGTG 

AATTCAACAC 

17160 

17170 

17180 17190 

17200 

17210 

17220 


>< Zsp2I 
>< PpulOI 

>< Nsil 
>< Mphll03I 
>< EcoT22l 

>< Bsgl > < Avalll >< DrdI 

TAGAACAGTA TGTTTTCTGC ACTGTAAATG CATTGCCAGA AACAACTGCT GACATTGTAG TCTTTGATGA 

17230 17240 17250 17260 17270 17280 17290 

>< Rmal 

>< MaeI >< Maell 

AATCTCTATG GCTACTAATT ATGACTTGAG TGTTGTCAAT GCTAGACTTC GTGCAAAACA CTACGTCTAT 

17300 17310 17320 17330 17340 17350 17360 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
x Dpnl 

>< BspAI X Rmal 

>< Alwlx Bspl43I > < Acil X Mael SspI >< 

ATTGGCGATC CTGCTCAATT ACCAGCCCCC CGCACATTGC TGACTAAAGG CACACTAGAA CCAGAATATT 

17370 17380 17390 17400 17410 17420 17430 

>< SinI 
>< Sau96I 

>< NspIV x Styl 

X NspHII >< NspI 
>< Eco47l >< NspHI 
>< Cfrl3I x Nlalll 
X BsiZI >< EcoT14I 

X Bsgl >< Ecol30I 

X Bmel8I x BssTlI 

X Tru9I X Avail >< BsaJI 

X Msel >< Asul> < AflUI 

TTAATTCAGT GTGCAGACTT ATGAAAACAA TAGGTCCAGA CATGTTCCTT GGAACTTGTC GCCGTTGTCC 

17440 17450 17460 17470 17480 17490 17500 

FIGURE 13. 40 
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>< HindIX 

>< Hindi >< Alul 

tgctgaaatt gttgacactg tgagtgcttt agtttatgac aataagctaa aagcacacaa ggataagtca 

17510 17520 ' 17530 17540 17550 17560 17570 


>< Alul X Nlalll 

gctcaatgct tcaaaatgtt ctacaaaggt gttattacac atgatgtttc atctgcaatc aacagacctc 

17580 17590 17600 17610 17620 17630 17640 


>< Mnll 
>< EcoNI 

>< BslI >< KphI 

X BsiYI >< Alul 

aaataggcgt tgtaagagaa tttcttacac gcaatcctgc ttggagaaaa gctgttttta tctcacctta 

17650 17660 17670 17680 17690 17700 17710 


>< Sfcl >< Ddel 

> < Alul >< Bfrl 

TAATTCACAG AACGCTGTAG CTTCAAAAAT CTTAGGATTG CCTACGCAGA 
17720 17730 17740 17750 17760 


X Tfil 
X Hinfl 

CTGTTGATTC ATCACAGGGT 
17770 17780 


> < Hindll 

>< Tthllll > < Hindi 

>< AspI X Acil 

TCTGAATATG ACTATGTCAT ATTCACACAA ACTACTGAAA CAGCACACTC TTGTAATGTC AACCGCTTCA 
17790 17800 17810 17820 17830 17840 17850 


>< XhoII 
X Sau3AI 
x Ndell 
x MfII 
x Mbol 
>< MamI 
x DpnII 
>< Dpnl 
X BstYI 
X BspAI 
X Bspl43l 
>< BsiBI 
>< BsaBI 

>< BspWI x BglU 

ATGTGGCTAT CACAAGGGCA AAAATTGGCA TTTTGTGCAT AATGTCTGAT AGAGATCTTT ATGACAAACT 

17860 17870 17880 17890 17900 17910 17920 


>< Xbal 

x Rmal >< MaeIII 

X Mael >< Maell BsrI X 

GCAATTTACA AGTCTAGAAA TACCACGTCG CAATGTGGCT ACATTACAAG CAGAAAATGT AACTGGACTT 

17930 17940 17950 17960 17970 17980 17990 


X Sau3AI 
X Ndell 

X MboII 
X Mbol 

> < FokI 
X DpnII 
>< Dpnl 
X BspAI 

x Tru9I x Bspl431 

>< Mseix Sfcl x Bbsl > < BsrI 


x NlalV 
X Eco64I 
>< BscBI 
X BanI 
>< AccBlI 


Mnll X 
>< Ddel 


FIGURE 13. 41 
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TTTAAGGACT GTAGTAAGAT CATTACTGGT CTTCATCCTA CACAGGCACC TACACACCTC AGCGTTGATA 

18000 18010 18020 18030 18040 18050 18060 


>< ScrFI 
>< Mval 
>< EcoRlI 
>< Eco57I 

>< Eel1361 


>< DsaV 
>< BstOI 


X Plel 


>< BstNI 
>< Hindllx BsiLI 
>< Hincllx Apyl 

TAAAGTTCAA GACTGAAGGA TTATGTGTTG ACATACCAGG CATACCAAAG 
18070 18080 18090 18100 18110 


X Nlalll 

Hinfl X 
AccI X 

GACATGACCT ACCGTAGACT 
18120 18130 


x Maelll 
X Eco0651 
x Eco91I 
x BstXI 

X BstPX 


Thai X 
Mval X 
BstUI >< 
Bsp50I X 

X Acil 


X BstEII X HphI AccII >< 

CATCTCTATG ATGGGTTTCA AAATGAATTA CCAAGTCAAT GGTTACCCTA ATATGTTTAT CACCCGCGAA 

18140 18150 18160 18170 18180 18190 18200 


x XmnI 

> < MboII 


X SfaNI 


> < Maelll 
X Asp700I 

X Alul X Maell >< Mnll 

GAAGCTATTC GTCACGTTCG TGCGTGGATT GGCTTTGATG TAGAGGGCTG 
18210 18220 18230 18240 18250 


>< Rmal 
>< Nlalll 
x Mael 

TCATGCAACT AGAGATGCTG 
18260 18270 


X Tru9I 
X Msel 


x Rsal 
>< Gsul 
>< Csp6I 
>< Bpml 
X Afal 

TGGGTACTAA CCTACCTCTC 
18280 18290 


>< Rmal 
x Mall 
x Mael 
X Alul 


X Sfcl 


X 

X 

X 


Hpal 
Hindll 
HincII 
X Ddel 
x Bfrl 


x Rsal 
x Csp6I 
X Alul Bsrl 
X Afal 


X 


CAGCTAGGAT TTTCTACAGG TGTTAACTTA GTAGCTGTAC CGACTGGTTA 
18300 18310 18320 18330 18340 


>< Hindu 

x HphI 

x Tru9l 

X HincII 

X EcoRI 

X Msel 



FIGURE 13.42 


x ScrFI 
x Mval 
X Mnll 
X Maelll 
X EcoRII 

x Eco0651 
x EcoNI 

x Eco91I 
X Ecll36I 
X DsaV Tru9I X 
X Dralll 
X BstPI 
X BstOI 

X BstNI Pmel X 
x BstEII 
>< BslI Msel X 
x BsiYI HphI x 
X BsiLI Dral >< 
X Apyl X Bsrl 
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TGTTGACACT GAAAATAACA CAGAATTCAC 
18350 18360 18370 


CAGAGTTAAT GCAAAACCTC CACCAGGTGA CCAGTTTAAA 
18380 18390 18400 18410 


>< ScrFI 
>< Mval 
>< EcoRII 
>< Ecll36I 
x DsaV 
>< BstOI 


>< Nlalll 

CATCTTATAC CACTCATGTA TAAAGGCTTG 
18420 18430 18440 


>< BstNI 
X BsiLI 

>< BsaJI > 

x Apyl > 

CCCTGGAATG TAGTGCGTAT 
18450 18460 


>< Rsal 

Ddel >< 

< Tru9IX Csp6I 

< Msel >< Afal 
TAAGATAGTA CAAATGCTCA 

18470 18480 


>< Nlalll 
>< HinPlI 

>< Tthllll >< Hin6I 

>< Hinfl > < Hhal 

X AspI X Plel > < Cfol >< Alul 

GTGATACACT GAAAGGATTG TCAGACAGAG TCGTGTTCGT CCTTTGGGCG CATGGCTTTG AGCTTACATC 

18490 18500 18510 18520 18530 18540 18550 


>< Sinl 
>< Sau96I 


X NspIV 
>< NspHII 
>< Eco47I 
X Cfrl3I 

>< Seal >< BsiZI 

>< Rsal >< Bmel8I 


>< Csp6I x Avail X Maell 

>< Afal x Asul >< Afllll >< Maelllx Maell 

AATGAAGTAC TTTGTCAAGA TTGGACCTGA AAGAACGTGT TGTCTGTGTG ACAAACGTGC AACTTGCTTT 

18560 18570 18580 18590 18600 18610 18620 


> < Tfil 


> < Hinfl 

TCTACTTCAT CAGATACTTA TGCCTGCTGG AATCATTCTG 
18630 18640 18650 18660 


X.Tthllll 
> < AspI 

TGGGTTTTGA CTATGTCTAT AACCCATTTA 
18670 18680 18690 


>< ScrFI 
Rsal >< 

>< Mval 
>< EcoRII 
EC1136I >< 


> < Maelll 

> < Eco0651 

> < Eco91I 


X DsaV 
Csp6I >< 
BstXI >< 
>< BstOI 
X BstNI 
>< BsiLI 


> < BstPI 

>< Eco57I> < BstEII 

TGATTGATGT TCAGCAGTGG GGCTTTACGG GTAACCTTCA 
18700 18710 18720 18730 


>< Apyl 

X Maelll >< Nlalll Afal >< 
GAGTAACCAT GACCAACATT GCCAGGTACA 
18740 18750 18760 


>< SfaNI 
>< Rmal 
X NspI 
X NspHI 

FIGURE 13.43 
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>< Nlalll 
>< Mael 


>< Rmal 
>< Nlalll 


>< Nlalll >< BspWI >< Mael 

> < Afllll >< BspHI 

TGGAAATGCA CATGTGGCTA GTTGTGATGC TATCATGACT AGATGTTTAG 
18770 ' 18780 18790 18800 18810 


Tru9I >< 
>< Nlalll 

Msel x 

CAGTCCATGA GTGCTTTGTT 
18820 18830 


X Thai 
X MvnI 


X HinPlI 
X Hin6l 
>< Hhal 
X Cfol 

x BstUI X EcoNI> < Mnll 

X Bsp50I x BslI x Tru9l 

X AccII >< BsiYI X Ddel X Msel 

AAGCGCGTTG ATTGGTCTGT TGAATACCCT ATTATAGGAG ATGAACTGAG GGTTAATTCT GCTTGCAGAA 

18840 18850 18860 18870 18880 18890 18900 


X Rsal 

X Csp6l x MboII > < Nlalll 

>< Afal X Nlalll X BspWI x BsrI >< BspHI 

AAGTACAACA CATGGTTGTG AAGTCTGCAT TGCTTGCTGA TAAGTTTCCA GTTCTTCATG ACATTGGAAA 

18910 18920 18930 18940 18950 18960 18970 


x Saul 
X Mstll 
X Eco81I 

X Ddel Nlalll X 


x CvnI 
X Bsu36I 
x Bse21I 


x EspI 

X Eco57I Maelll X 
>< Ddel 


X Axyl 
>< AocI 


TCCAAAGGCT ATCAAGTGTG TGCCTCAGGC 
18980 18990 19000 


X CelII 

X Mnll >< SEaNI X Bpull02l 

TGAAGTAGAA TGGAAGTTCT ACGATGCTCA GCCATGTAGT 
19010 19020 19030 19040 


>< Mn.ll x Ksp632I 

X Hindlll X Earl 

X Alul >< MboII X Earall04I 

GACAAAGCTT ACAAAATAGA GGAACTCTTC TATTCTTATG CTACACATCA CGATAAATTC ACTGATGGTG 

19050 19060 19070 19080 19090 19100 19110 


>< Sau3AI 
x Ndell 
X Mbol 

x MaelI> < Maelll 
X DpnII 
X Dpnl 

X BspAI Htnfl > 

X Maelll >< Bspl431 >< Muni DrdI X 

TTTGTTTGTT TTGGAATTGT AACGTTGATC GTTACCCAGC CAATGCAATT GTGTGTAGGT TTGACACAAG 

19120 19130 19140 19150 19160 19170 19180 


>< ScrPI 
X Mval 
X EcoRII 


Zsp2I X 

X SphI 
> < PpulOI 
x Pael 
>< NspI 
X NspHI 
X Nlalll 
Mphl1031 >< 


FIGURE 13.44 
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x Plel 

agtcttgtca aacttgaact 
19190 19200 


>< Ecll36I 
>< DsaV 


>< Gsul 
EcoT22I X 


>< BstOI 
X BstNI 


>< Bstal 
X BscCI 


X BsiLI 


>< Bpml X Nsil 


X Apyl >< Avalll 

TACCAGGCTG TGATGGTGGT AGTTTGTATG TGAATAAGCA TGCATTCCAC 
19210 19220 19230 19240 19250 


>< TthHB8I 
x Bcgl/a >< TaqI 
X Alul 

ACTCCAGCTT TCGATAAAAG TGCATTTACT 
19260 19270 19280 


>< Tru9I 

> < Muni 


X Msel 
X Dral 
X Bcgl 

AATTTAAAGC AATTGCCTTT 
19290 19300 


CTTTTACTAT TCTGATAGTC 
19310 19320 


>< Plel 
>< Nlalll 


SfaNI X 

x MaeII 


X BsmAI BsaAI x 

X Hinfix Alw26I AflUI X 

CTTGTGAGTC TCATGGCAAA CAAGTAGTGT CGGATATTGA TTATGTTCCA CTCAAATCTG CTACGTGTAT 

19330 19340 19350 19360 19370 19380 19390 


Zsp2I > 
>< Seal 
PpulOI x 
>< RsaINsi.1 > 
Mphll03I > 
X SfaNIEcoT22I > 
> < Rsal >< Csp6I 
X Csp6I Avalll x 

>< NlaIII> < Afal >< Afal 

TACACGATGC AATTTAGGTG GTGCTGTTTG CAGACACCAT GCAAATGAGT ACCGACAGTA CTTGGATGCA 

19400 19410 19420 19430 19440 19450 19460 


x FokI 

TATAATATGA TGATTTCTGC TGGATTTAGC CTATGGATTT ACAAACAATT TGATACTTAT AACCTGTGGA 

19470 19480 19490 19500 19510 19520 19530 


>< ScrFI 
x Mval 
X Maelll 
X EcoRII 

x Ecll36I 
>< DsaV 

x BstOI 
x BstNI 

x BsiLI >< Tru9I 

x Apyl >< Msel 

ATACATTTAC CAGGTTACAG AGTTTAGAAA ATGTGGCTTA TAATGTTGTT AATAAAGGAC ACTTTGATGG 

19540 19550 19560 19570 19580 19590 19600 


X SgrAI 
>< Nael 

X MspI > 

>< Hpall > 

>< HapII > 

>< CfrlOI > 

X BspWI > 

ACACGCCGGC GAAGCACCTG TTTCCATCAT 
19610 19620 19630 


< VspI 

< Tru9I 

< Msel 

< Asnl 

< Asel 

TAATAATGCT GTTTACACAA AGGTAGATGG TATTGATGTG 
-19640 19650 19660 19670 


FIGURE 13. 4 5 
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>< XhoXI 
>< Sau3AI 
>< Ndell 
>< Mfll 
>< Mbol 


>< DpnIX 



>< Dpnl 


>< Maelll 

X BstYI 


x EspI 

>< BspAI 


>< DdeITru9I >< 

>< Bspl43I 

X Tru9I 

X CelllMsel >< 

>< Bglll 

x Msel 

X Alul >< Bpull02I 


GAGATCTTTG AAAATAAGAC AACACTTCCT GTTAATGTTG CATTTGAGCT TTGGGCTAAG CGTAACATTA 

19680 19690 19700 19710 19720 19730 19740 

>< Fnu4HI 

>< Tru9I >< EcoRV 

>< BsrI >< Msel >< Bbvl >< Eco32I 

AACCAGTGCC AGAGATTAAG ATACTCAATA ATTTGGGTGT TGATATCGCT GCTAATACTG TAATCTGGGA 

19750 19760 19770 19780 19790 19800 19810 


>< NspI 
>< NspHI 
>< Nlalll 
X BsgX 
X Afllll 

CTACAAAAGA GAAGCCCCAG CACATGTATC TACAATAGGT GTCTGCACAA TGACTGACAT TGCCAAGAAA 

19820 19830 19840 19850 19860 19870 19880 


>< DdeIX Mbol I >< AccI 

CCTACTGAGA GTGCTTGTTC TTCACTTACT GTCTTGTTTG ATGGTAGAGT GGAAGGACAG GTAGACCTTT 

19890 19900 19910 19920 19930 19940 19950 


SinI X 
Sau96I X 
NspIV x 
NspHII >< 
NlalV >< 
Eco47I x 
Cfrl3I >< 

>< BslI 
BsiZI >< 

>< BsiYI 
BscBI >< 
Bmel8I >< 

>< Tru9I Avail X 

X Msel Asul X 

TTAGAAACGC CCGTAATGGT GTTTTAATAA CAGAAGGTTC AGTCAAAGGT CTAACACCTT CAAAGGGACC 

19960 19970 19980 19990 20000 20010 20020 


X VspI 
>< Tru9I 


>< Rraal 
x Nhel 
>< Mael 

X Hgalx Alul 
AGCACAAGCT AGCGTCAATG 
20030 20040 


X Plel 
x Msel 
x Maelll 

X AsnX >< Tfil 


Tru9I X 
X Tru9I 

Msel X 


>< Hinfix Asel >< Hinfl >< Msel 

GAGTCACATT AATTGGAGAA TCAGTAAAAA CACAGTTTAA CTACTTTAAG 
20050 20060 20070 20080 20090 


x Ddel >< Mnll Tru9I x 
>< BsmAI >< Ddel 


FIGURE 13.46 
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X AccI X Alw26I X BfrIMsel X 

aaagtagacg gcattattca acagttgcct gaaacctact ttactcagag cagagactta gaggatttta 

20100 20110 20120 20130 20140 20150 20160 

X TthHBSI 
X TaqI 

>< SstI 





>< Sdul 

Xhol X 




X SacI 

TthHB8I > 


> 

< 

PaeR7I 

TaqI > 


> 

< 

NspIII 

Slal X 




>< NspII 

PaeR7I x 




>< HgiAI 

NspIII >< 


> 

< 

EcoB8I 

X Mnll 

x Xcml 

> 

< 

XhoIX Eco241 

Eco88I X 

X Sau3AI 



X Ecll36II 

Ccrl X 

x Ndell 

> 

< 

SlalX Bspl2861 

BspWI >< 

X Mbol 

> 

< 

Ccrlx Bmyl 

Bcol >< 

X DpnII 

> 

< 

Bcolx Banll 

> < Bcgl/a 

X Dpnl 

> 

< 

Ama87I 

Aval >< 

>< BspAI 

> 

< 

Avalx Alw21I 

Araa87I x 

>< Bspl43I 



X Alul >< ] 

EcoRI X FoklAluI >< 

AGCCCAGATC ACAAATGGAA 

ACTGACTTTC 

TCGAGCTCGC TATGGATGAA 

TTCATACAGC GATATAAGCT 

20170 20180 

20190 


20200 20210 

20220 20230 


X TthHB8I 
X TaqI 
>< Sful 
>< NspV 
>< LspI 
>< Csp45I 
X BstBI 
>< Bspll9I 

>< BsiCI >< MboII 

>< Bpul4I >< Bbsl Tru9I X 

x AsuII >< Bcgl >< Nlalll X AcilMsel >< 

cgagggctat gccttcgaac acatcgttta tggagatttc agtcatggac aacttggcgg tcttcattta 

20240 20250 20260 20270 20280 20290 20300 


>< HphI 
>< HinPlI 
X Hin6I 


>< 

EspI > 

< 

Hhal X Tfil 






>< 

Ddel 

>< 

Haell 






>< 

Celll >< 

Eco47III 

>< 

Tru9I 




>< 

Bpull02I > 

< 

Cfol X Hinfl 

>< 

Msel 




>< 

BfrI 

>< 

Bspl4 3II 

>< 

Mnll 




ATGATAGGCT 

TAGCCAAGCG 

CTCACAAGAT TCACCACTTA 

AATTAGAGGA 

TTTTATCCCT ATGGACAGCA 

20310 

20320 


20330 

20340 


20350 

20360 

20370 




X MstI 









>< HinPlI 




Sau3AI 

>< 




>< Hin6I 




Ndell 

>< 




>< Hhal 




Mbol 

>< 




x EspI 




DpnII 

>< 




x Fdill 




Dpnl x 




>< Cfol 




BspAI 

>< 


>< SfaNI 

x Avill 




Bspl43l x 

CAGTGAAAAA 

TTACTTCATA 

ACAGATGCGC AAACAGGTTC 

ATCAAAATGT 

GTGTGTTCTG TGATTGATCT 

20380 

20390 


20400 

20410 


20420 

20430 

20440 


X TthHB8I 

FIGURE 13.47 
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>< Tthllll 
>< TaqX 

>< AspI > < MaeIII Maelll >< 

TTTACTTGAT GACTTTGTCG AGATAATAAA GTCACAAGAT TTGTCAGTGA TTTCAAAAGT GGTCAAGGTT 

20450 20460 20470 20480 20490 20500 20510 


>< NspI 
X NspHI 
X Nlalll 
>< FokI 

x Muni > < Nlalll >< Afilll . 

ACAATTGACT ATGCTGAAAT TTCATTCATG CTTTGGTGTA AGGATGGACA TGTTGAAACC TTCTACCCAA 

20520 20530 20540 20550 20560 20570 20580 


>< SfaNI 
>< ScrFI 
>< Mval 
X EcoRII 
>< Ecll36I 


>< DsaV 


>< BstOI 
>< BstNI 
>< BsiLI 


>< SfaNI 

>< Rsal 
> < Csp6l 


BspWI >< 

Bsrnl > 


>< BspWI >< Apyl 

AACTACAAGC AAGTCAAGCG TGGCAACCAG GTGTTGCGAT GCCTAACTTG 
20590 20600 20610 20620 20630 


>< Afal BscCI >< 
TACAAGATGC AAAGAATGCT 
20640 20650 


>< Eco57I >< Maelll X KphI 

TCTTGAAAAG TGTGACCTTC AGAATTATGG TGAAAATGCT GTTATACCAA AAGGAATAAT GATGAATGTC 
20660 20670 20680 20690 20700 20710' 20720 


> < Rsal 
X Csp6I 

X Bstll07I X Tru9I X Alul 

X AccI x Msel > < AfalNlalll X 

GCAAAGTATA CTCAACTGTG TCAATACTTA AATACACTTA CTTTAGCTGT ACCCTACAAC ATGAGAGTTA 

20730 20740 20750 20760 20770 20780 20790 


>< ScrFI 

X Rsal 
>< Mval 

X EcoRII X NspBII 

X Ecll36I X Sdul 

> < Csp6I X NspII 

>< BstOI >< PvuIIX HgiAI 
X BstNI X Ddel 

>< BsiLI >< PspSIX BspI286I 
>< Apyl >< Alul X Bmyl 
x Dsavx Afal >< Alw21I 

TTCACTTTGG TGCTGGCTCT GATAAAGGAG TTGCACCAGG TACAGCTGTG CTCAGACAAT GGTTGCCAAC 

20800 20810 20820 20830 20840 20850 20860 

X XhoII 

x Tru9I 
X Sau3AI 
X Ndell 

>< TthHB8I x Msel 
x MfII 
X Mbol 
x MamI 
x DpnII 
>< Tfil x Dpnl 


FIGURE 13. 4 8 
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>< BstYI > < Tfil 

>< BspAI > < Hinfl 

>< Hinflx Bspl43I >< Esp3I >< Tru9I 

>< BsiBI X Tthllll >< BsmBI >< Msel 

>< BsaBI X BsmAI > < BsmAI 

>< BsrI >< TaqI >< Bglll >< AspI >< Alw26I >< Hgal> < Alw26I 
TGGCACACTA CTTGTCGATT CAGATCTTAA TGACTTCGTC TCCGACGCAG ATTCTACTTT AATTGGAGAC 

20870 20880 20890 20900 20910 20920 20930 


> 

> 

> 

> 

> 

> 

> 

> 

> 


>< Rsal > 

> < Csp6I > 

>< Afal > 

TGTGCAACAG TACATACGGC TAATAAATGG 

20940 20950 20960 


< SinI 

< Sau96I 

>< PssI 
>< PspSXI 

< PpuMI 

< NspIV 
x NspHII 
x NlalV 

< Eco0109I 

< Eco47I 

< Drall 

< Cfrl3I 

< BsiZI 
X BscBI 

< Bmel8I 

< Avail 

< Asul 

GACCTTATTA TTAGCGATAT 
20970 20980 


X Styl 

x SinI 
x Sau96I 
x Rmal 

X NspIV 
NspHII X 
X Mael 
X EcoT14I 

X Eco47I 
X Ecol30l 

X Cfrl3I 
x BssTlI 

x BsiZI 
x BsaJI 

X Bmel8I 
X Blnl 
X AvrII 

X Avail 
x Asul 
Afllll X 
GTATGACCCT AGGACCAAAC 
20990 21000 


x NspI 
x NspHI 

>< Nlalll >< Plel Rmal x 

x Maelll x Hinfl Mael x 

ATGTGACAAA AGAGAATGAC TCTAAAGAAG GGTTTTTCAC TTATCTGTGT GGATTTATAA AGCAAAAACT 
21010 21020 21030 21040 21050 21060 21070 

X ScrFI 
X Mval 
>< EcoRII 
X EC1136I 
>< DsaV 


X BstOI 





Sau96I > 

X BstNI 





NspIV > 

X BsiLI 





Cfrl3I > 

X BsaJI 





BsiZI > 

>< BsaJI 

X Sfcl 

x Bsml X BsmI 

Asul > 

X Apyl 

> 

< Alul 

X BscCI 

X BscCIHindlll 

XX Alul 

AGCCCTGGGT GGTTCTATAG 

CTGTAAAGAT 

AACAGAGCAT 

TCTTGGAATG CTGACCTTTA 

CAAGCTTATG 

21080 

21090 

21100 

21110 

21120 21130 

21140 





X Zsp2I 






X PpulOI 


X Pall 




X Nsil 


>< Haelll 




X Mphll03I Tru9I X 

>< BsuRI 


x Maelll 

X EcoT22I 

>< Msel 

X BshI 

X NlalllX Alul 

x Bcgl 

x Avalll x SfaNIBcgl/a X 

GGCCATTTCT CATGGTGGAC 

AGCTTTTGTT 

ACAAATGTAA 

ATGCATCATC ATCGGAAGCA 

TTTTTAATTG 

21150 

21160 

21170 

21180 

21190 21200 

21210 


FIGURE 13.49 
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>< Zsp2I 
>< SphI 
>< PpulOI 

>< Pael 
>< NspI 
>< NspHI 
>< Nsil 
>< Nlalll 

> < Nlalll 

>< Mphll03I 
>< EcoT22I 

> <. Avalll >< Mnll 

GGGCTAACTA TCTTGGCAAG CCGAAGGAAC AAATTGATGG CTATACCATG CATGCTAACT ACATTTTCTG 

21220 21230 21240 21250 21260 21270 21280 


X MboII 


Tru9I X 
>< Tru9I 


X Gsul 
X BsrI 
x Bpral 
x Bbsl 

GAGGAACACA AATCCTATCC AGTTGTCTTC 
21290 21300 21310 


x Nlalll 

CTATTCACTC TTTGACATGA GCAAATTTCC 
21320 21330 21340 


Ms el X 
>< Msel 
Mnll x 
X Mnll 
TCTTAAATTA 
21350 


>< Tru9I 
>< Msel 

x Esp4I> < Tfil 

>< BsmAI Ksp632I X 

X Alw26I X MboII x Earl 

x Af1II> < Hinfl Eamll04I x 

AGAGGAACTG CTGTAATGTC TCTTAAGGAG AATCAAATCA ATGATATGAT TTATTCTCTT CTGGAAAAAG 

21360 21370 21380 21390 21400 21410 21420 


X Tru9I 
X Msel 
x Hindu 
X Hindi 
X Hpal AflUI > 

GTAGGCTTAT CATTAGAGAA AACAACAGAG TTGTGGTTTC AAGTGATATT CTTGTTAACA ACTAAACGAA 

21430 21440 21450 21460 21470 21480 21490 


x Vnel 
>< Snol 

x Sdul 
X NspII 
X HpalI 

x HgiAI 
X HapII 
X CfrlOI 

x Bspl286I 
X MspIX Brayl 


>< NspI 



X Spel 


>< ApaLI 

X NspHI 



x Rmal 


X Alw44I 

>< Nlalll 



X Mael 

x MaelII 

X AgeI x 

Alw21I 

CATGTTTATT TTCTTATTAT 

TTCTTACTCT 

CACTAGTGGT 

AGTGACCTTG 

ACCGGTGCAC 

CACTTTTGAT 

21500 

21510 

21520 

21530 

21540 

21550 

21560 

> < 

Alul 


x Mnll 




GATGTTCAAG CTCCTAATTA 

CACTCAACAT 

ACTTCATCTA 

TGAGGGGGGT 

TTACTATCCT 

GATGAAATTT 

21570 

21580 

21590 

21600 

21610 

21620 

21630 


x Sau3AI 
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>< Ndell 







>< Mbol 







>< DpnII 







>< Dpnl >< 

Tru9I 





>< BspAI 

>< 

Msel > 

< MbolI 




>< Bspl43I 

>< Ddel 


>< Maelll 

TTAGATCAGA 

CACTCTTTAT TTAACTCAGG 

ATTTATTTCT 

TCCATTTTAT 

TCTAATGTTA 

CAGGGTTTCA 

21640 

21650 

4 

21660 

21670 

21680 

21690 

21700 

>< VspI 






>< Tru9I 






>< Msel 






>< Asnl 


X 

Tru9I 

X FokI 

>< Asel >< Maell 


>< 

Msel >< Bbvl > 

< Fnu4HI 

TACTAT TAAT 

CATACGTTTG GCAACCCTGT 

CATACCTTTT 

AAGGATGGTA 

TTTATTTTGC 

TGCCACAGAG 

21710 

21720 

21730 

21740 

21750 

21760 

21770 


>< 

BslI 






>< Dsaix 

BsiYI 


x Nlalll 




>< BsaJI 



> 

< Maelll 


AAATCAAATG 

TTGTCCGTGG TTGGGTTTTT 

GGTTCTACCA 

TGAACAACAA 

GTCACAGTCG 

GTGATTATTA 

21780 

21790 

21800 

21810 

21820 

21830 

21840 




>< NspI 




>< Tru9I 



X NspHI 



>< Msel 



X Nlalll 



>< HphI 



>< Maelll >< Maelll 


TTAACAATTC 

TACTAATGTT GTTATACGAG 

CATGTAACTT 

TGAATTGTGT 

GACAACCCTT 

TCTTTGCTGT 

21850 

21860 

21870 

21880 

21890 

21900 

21910 

>< 

Styl 



>< 

Zsp2I 



>< Nlalll 




x Tru9I 


>< 

Ncol >< Rsal 



>< PpulOI TthHB8I >< 

>< 

ECOT14I 



>< 

Nsil 

>< TaqI 

>< 

Ecol30I 




x Msel 

SfaNI x 

>< 

Dsaix Csp6I 



>< 

Mphll03I 

Rsal >< 

>< 

BssTlI 


>< 

TthHB8I >< 

EcoT22I 

Csp6I >< 

>< 

BsaJIx Afal 


X 

TaqI >< Avalll 

Afal >< 

TTCTAAACCC 

ATGGGTACAC AGACACATAC 

TATGATATTC 

GATAATGCAT 

TTAATTGCAC 

TTTCGAGTAC 

21920 

21930 

21940 

21950 

21960 

21970 

21980 


>< Tru9I 
>< Msel 
>< Oral 

ATATCTGATG CCTTTTCGCT TGATGTTTCA GAAAAGTCAG GTAATTTTAA ACACTTACGA GAGTTTGTGT 

21990 22000 22010 22020 22030 22040 22050 

>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 


X Tru9I 






x Dpnl 

>< Msel 






X BspAI 

>< Dral 




X Sfcl 

Bspl43I x 

TTAAAAATAA 

AGATGGGTTT 

CTCTATGTTT 

ATAAGGGCTA 

TCAACCTATA GATGTAGTTC 

GTGATCTACC 

22060 

22070 

22080 

22090 

22100 

22110 

22120 





X Tru9I 



X 

Tru9I 

> 

< Tru9I 

>< Msel 



X 

Msel 

> 

< Msel 

X Mnll 



TTCTGGTTTT 

AACACTTTGA 

AACCTATTTT 

TAAGTTGCCT 

CTTGGTATTA ACATTACAAA 

TTTTAGAGCC 

22130 

22140 

22150 

22160 

22170 

22180 

22190 




FIGURE 13 
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> < SduIX Sfcl 


> 


> 

> 

>< BspMI > 

>< HphI >< Bbvl 

ATTCTTACAG CCTTTTCACC TGCTCAAGAC ATTTGGGGCA 
22200 22210 22220 22230 


>< PvuII 
>< Psp5I 

< NspII 

>< NspBII 

< MaeII > < Fnu4HI 

< Bspl286I >< PstI Tru9l > 

< Bmyix Fnu4HI Msel > 

X Alul X Bbvl 

CGTCAGCTGC AGCCTATTTT GTTGGCTATT 
22240 22250 22260 


>< SfaNI 


x Rsal 
> < Csp6I 

>< Dral X Afal >< AlwNI 

TAAAGCCAAC TACATTTATG CTCAAGTATG ATGAAAATGG TACAATCACA GATGCTGTTG ATTGTTCTCA 

22270 22280 22290 22300 22310 22320 22330 


> < Tru9I 

> < Msel 

>< Alul 

AAATCCACTT GCTGAACTCA AATGCTCTGT TAAGAGCTTT GAGATTGACA AAGGAATTTA CCAGACCTCT 

22340 22350 22360 22370 22380 22390 22400 

>< Saul 
X Mstll 
>< Eco81I 
X Ddel 
>< CvnI 
X Bsu36I 
>< Bse21I 

X Axyl X Tfil 

X Mnll >< AocI X Mnll X Hinfl X SspI X Mnll 

AATTTCAGGG TTGTTCCCTC AGGAGATGTT GTGAGATTCC CTAATATTAC AAACTTGTGT CCTTTTGGAG 

22410 22420 22430 22440 22450 22460 22470 


x Zsp2l 
>< PpulOI 
x Nsil 

> < Nlalll 
X Mphll03I 

>< Tru9l ’ X EcoT22I 

>< MseX >< AvaXII 

AGGTTTTTAA TGCTACTAAA TTCCCTTCTG TCTATGCATG GGAGAGAAAA AAAATTTCTA ATTGTGTTGC 

22480 22490 22500 22510 22520 22530 22540 

x Sdul 
>< NspII 
X HgiAI 
x Bspl286I 
x Bmyl 
X ALw21I 

TGATTACTCT GTGCTCTACA ACTCAACATT TTTTTCAACC 

22550 22560 22570 22580 


>< Tru9I 

>< Msel Ddel x 

TTTAAGTGCT ATGGCGTTTC TGCCACTAAG 
22590 22600 22610 


>< Sau3AI 
>< Ndell 
>< Mbol 
X DpnII 
x Dpnl 


FIGURE 1352 
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>< BspAI >< Tfil 

>< Bspl43I >< Hinfl 

TTGAATGATC TTTGCTTCTC CAATGTCTAT GCAGATTCTT TTGTAGTCAA GGGAGATGAT GTAAGACAAA 

22620 22630 22640 22650 22660 22670 22680 

>< ScrFI 
>< Mval 
X HinPlI 
>< Hin6I 
>< Hhal 
>< Haell 
X EcoRII 
>< EC1136I 
>< DsaV 
>< Cfol 
>< BstOI 
X BstNI 
X Bspl4311 
x BsiLI 

x Apyl > < BsrX >< Nlalll 

TAGCGCCAGG ACAAACTGGT GTTATTGCTG ATTATAATTA TAAATTGCCA GATGATTTCA TGGGTTGTGT 

22690 22700 22710 22720 22730 22740 22750 

X SfaNI 

>< Rmal Ddel X 

>< Mae! x BsrI BfrI x 

CCTTGCTTGG AATACTAGGA ACATTGATGC TACTTCAACT GGTAATTATA ATTATAAATA TAGGTATCTT 

22760 22770 22780 22790 22800 22810 22820 


>< Sau96I 
X Pall 
x NspIV 
> < Hindlll 

X Haelll 
>< EcoO109I 
>< Drall 
x Ddel 

>< Cfr131 
X BsuRI 
>< BsiZI 
x BshI 

x BfrI x PssI 
>< Nlalll >< Asulx BsmAI 

X Alul X Alw26I BspWI X 

AGACATGGCA AGCTTAGGCC CTTTGAGAGA GACATATCTA ATGTGCCTTT CTCCCCTGAT GGCAAACCTT 

22830 22840 22850 22860 22870 22880 22890 


>< Tru9I 
x Pall 
X MscI 
x Haelll 
x Eaelx Msel 
>< Tru9I X BsuRI 

x Msel x BshI 

x BspMI >< Ball BsrI >< 

GCACCCCACC TGCTCTTAAT TGTTATTGGC CATTAAATGA TTATGGTTTT TACACCACTA CTGGCATTGG 

22900 22910 22920 22930 22940 22950 22960 


Sau96I x 
>< PallNspIV x 
> < Mspl NspHII x 
>< Haelll 


FIGURE 13.53 
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> < Hpall Eco47I >< 

>< Dsal 

> < HapII Cfrl3I >< 

>< BsuRISinI >< 

>< Gdill BsiZI >< 

>< Seal >< BsaJI 

>< Rsal >< Tru9I >< Eael BmelSI >< 

>< Csp6I X Msel >< CfrlOI Avail >< 

X Afal >< Dral x BshI Asul >< 

CTACCAACCT tacagagttg tagtactttc ttttgaactt ttaaatgcac cggccacggt ttgtggacca 

22970 22980 22990 23000 23010 23020 23030 


>< Tru9I x Rsal 

X Tru9I >< Csp6I 

X Plel BsrI X 



> 

< 

Tru91 



x Msel 


X BsrI 


> 

< 

MssIX BsrI 


x Msel X 

Hinfl 

x Afal 

AAATTATCCA CTGACCTTAT 

TAAGAACCAG 

TGTGTCAATT 

TTAATTTTAA TGGACTCACT 

GGTACTGGTG 

23040 

23050 


23060 


23070 

23080 

23090 

23100 

X Tru9I 






X Pall 



X Msel 






X Haelll 



X MbolI 






x Gdill 



>< Hpal 






X Eael 



X Hindu 






x BsuRI 


Tfil x 

X Hindi 






X BshI 


Hinfl x 

TGTTAACTCC TTCTTCAAAG 

AGATTTCAAC 

CATTTCAACA 

ATTTGGCCGT GATGTTTCTG 

ATTTCACTGA 

23110 

23120 


23130 


23140 

23150 

23160 

23170 


> < XhoII 
X TthHB8I 
>< TaqI 

> < Sau3AI 

> < Ndell 

> < MfII 

> < Mbol 

> < DpnII 

X Dpnl 

> < BstYI 


> < BspAI 

> 

< SspI 




X Alwl X Bspl43I 


X HphI 




TTCCGTTCGA GATCCTAAAA 

CATCTGAAAT 

ATTAGACATT 

TCACCTTGCT 

CTTTTGGGGG 

TGTAAGTGTA 

23180 23190 

23200 

23210 

23220 

23230 

23240 

X ScrFI 

x Mval 






>< EcoRII 






X Ecll36I 




X Tru9I 


>< DsaV 




>< Msel 


X BstOI 




X Hpal 


X BstNI 




>< Hindi! 

X BsiLI 



X Eco57I 


X Apyl 



x Bsgl 

x Hindi 

ATTACACCTG GAACAAATGC 

TTCATCTGAA 

GTTGCTGTTC 

TATATCAAGA 

TGTTAACTGC 

ACTGATGTTT 

23250 23260 

23270 

23280 

23290 

23300 

23310 


X Sau3AI 
X Nlalll 
x Ndell 
X Mbol 
X DpnII 
X Dpnl 


x HinPlI 
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>< BspWI >< Hin6I 

>< BspAI > < Hhal Plel >< 

>< Sfcl >< Bspl43I >< Alul> < Cfol >< BsrI 

CTACAGCAAT TCATGCAGAT CAACTCACAC CAGCTTGGCG CATATATTCT ACTGGAAACA ATGTATTCCA 
23320 23330 23340 23350 23360 23370 23380 

>< TthHBSX 
>< TaqI 
>< Sail 
>< Rtrl 
>< NspI 

>< EspI >< NspHI 
>< Ddel >< Nlalll 
>< Celll >< Hindu 
>< Bpull02I>< Hindi 

>< Hinfl >< Alul >< AccI 


GACTCAAGCA GGCTGTCTTA 

TAGGAGCTGA 

GCATGTCGAC 

ACTTCTTATG 

AGTGCGACAT 

TCCTATTGGA 

23390 23400 

23410 

23420 

23430 

23440 

23450 



> 

< SnaBl 






>< Seal 





>< Rsal 






x Rmal 




>< 

Maell x Mael 




> 

< Ecol05I 



>< Rmal 



X Csp6I 


>< Maelll 

> 

< BsaAI 



X Alul x Mael 



X Afal 


GCTGGCATTT GTGCTAGTTA 

CCATACAGTT 

TCTTTATTAC 

GTAGTACTAG 

CCAAAAATCT 

ATTGTGGCTT 

23460 23470 

23480 

23490 

23500 

23510 

23520 


x Muni 




ATACTATGTC' TTTAGGTGCT 

GATAGTTCAA 

TTGCTTACTC 

TAATAACACC 

ATTGCTATAC 

CTACTAACTT 

23530 23540 

23550 

23560 

23570 

23580 

23590 






Rsal x 





X Mnll 






Csp6I x 

>< Sfcl 




Afal x 

TTCAATTAGC ATTACTACAG 

AAGTAATGCC 

TGTTTCTATG 

GCTAAAACCT 

CCGTAGATTG 

TAATATGTAC 

23600 23610 

23620 

23630 

23640 

23650 

23660 

> < Tfil 

> < Hinfl 






>< Acil 



> 

< Alul 


ATCTGCGGAG ATTCTACTGA 

ATGTGCTAAT 

TTGCTTCTCC 

AATATGGTAG 

CTTTTGCACA 

CAACTAAATC 

23670 23680 

23690 

23700 

23710 

23720 

23730 

X Vnel 






>< Sdul 
x NspII 
>< HgiAI 



x Pmll 



>< Snoix Ddel 

X 

Sau3AI 

x PmaCI 



X Bspl2861 

X 

Ndell 

X Maell 



X Bmyl 

>< 

Mbol 

x Eco72I 



X Bbvl 


x Dpnl 

x BsaAI 



X ApaLI 


>< Bspl431 

>< BbrPI 



>< Alw4 41 

>< 

DpnII >< Alwl 



X Alw211 x 

Fnu4HI >< 

BspAI x 

Af IIII 



GTGCACTCTC AGGTATTGCT 

GCTGAACAGG 

ATCGCAACAC 

ACGTGAAGTG 

TTCGCTCAAG 

TCAAACAAAT 

23740 23750 

23760 

23770 

23780 

23790 

23800 
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>< Rsal 


>< Csp6I 



>< Tru9I 





>< Afal 


>< SspI 

>< Msel 


>< 

SspI 


gtacaaaacc 

CCAACTTTGA 

AATATTTTGG 

TGGTTTTAAT TTTTCACAAA 

TATTACCTGA 

CCCTCTAAAG 

23810 

23820 

23830 

23840 

23850 


23860 

23870 

>< Mnll 








>< Mnll 



>< Tru9I 

>< SfaNI 

>< HphI 

Nlalll >< 

>< Ddel 

>< Mnll 


>< Msel >< 

Maelll 


BspHI >< 

CCAACTAAGA 

GGTCTTTTAT 

TGAGGACTTG 

CTCTTTAATA AGGTGACACT 

CGCTGATGCT 

GGCTTCATGA 

23880 

23890 

23900 

23910 

23920 


23930 

23940 


>< XhoII 
>< Sau3AI 


>< Styl 


>< 

Rmal 


>< Rmal 



>< Ndell 


>< Mael 



>< Mfll 


>< EcoT14I 



>< Mbol 

x MstI 

>< Ecol30I 


>< 

Mael 

>< HinPlI 

>< BssTlI 

>< 

VspI 

>< DpnII 

>< Hin6I 

>< Bsml 


X 

Hphl> < Dpnl 

x Hhal 

BscCI 

>< 

Tru9I 

X BstYI 

X FspI 

>< BsaJI 

>< 

Msel 

>< BspAI 

>< Fdill 

X Blnl 

>< 

Asnl 

> < Bspl43I 

x Cfol 

>< AvrII 

>< 

Asel 

x Bglll 

>< Avill 


AGCAATATGG CGAATGCCTA GGTGATATTA ATGCTAGAGA TCTCATTTGT GCGCAGAAGT TCAATGGACT 
23950 23960 23970 23980 23990 24000 24010 

X RmaIRsal >< 

>< Mnll >< Fnu4HI >< Fnu4HI Csp6I >< 

>< BspWI >< Bbvl >< Bbvl >< BspWI >< MaelAfal >< 

TACAGTGTTG CCACCTCTGC TCACTGATGA TATGATTGCT GCCTACACTG CTGCTCTAGT TAGTGGTACT 

24020 24030 24040 24050 24060 24070 24080 

>< MboII 
>< HinPlI 
>< Hin6I 
>< Hhal 
>< Haell 

>< Fnu4HI >< Ksp632I 
>< Cfol >< Earl 

>< FokI >< BspWI >< Eamll04I 

>< Bbvl >< Bspl43II 

GCCACTGCTG GATGGACATT TGGTGCTGGC GCTGCTCTTC AAATACCTTT TGCTATGCAA ATGGCATATA 

24090 24100 24110 24120 24130 24140 24150 

Tru9I >< 

>< Maelll Msel >< 

GGTTCAATGG CATTGGAGTT ACCCAAAATG TTCTCTATGA GAACCAAAAA CAAATCGCCA ACCAATTTAA 


24160 

24170 

24180 

24190 

24200 

24210 

24220 






Maell 

>< 



X Tfil 



x Fnu4HI 



>< Hinfl 


X Bbvl 

X Alul 


CAAGGCGATT AGTCAAATTC 

AAGAATCACT 

TACAACAACA TCAACTGCAT TGGGCAAGCT GCAAGACGTT 

24230 

24240 

24250 

24260 

24270 

24280 

24290 

>< Tru9I 







>< Msel 







>< Hpal 




X Ddel 



>< Hindu 

x Bsml 

>< Tru9I 

X Tru9I 

x BfrI 



>< Hinclix 

BscCI 

X Msel 

X Msel 

X Alul 
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GTTAACCAGA ATGCTCAAGC ATTAAACACA CTTGTTAAAC AACTTAGCTC TAATTTTGGT GCAATTTCAA 

24300 24310 24320 24330 24340 24350 24360 


>< Thai 


>< 

X 


EcoRV 

Eco32X 


x 

X 

X 

X 

X 

X 


Spol 

Ncul 

MvnI 

BstUl 

Bsp68l 

Bsp50l 


X TthHB8l 

X TaqI >< Rsal 

X Mnll X Csp6I 

X AcilX AfaX 


x Tru9I 
x Msel 


X AccII X Mnll 

GTGTGCTAAA TGATATCCTT TCGCGACTTG ATAAAGTCGA GGCGGAGGTA CAAATTGACA GGTTAATTAC 

24370 24380 24390 24400 24410 24420 24430 


X Maelll X Bbvl X Fnu4HI Bbvl >< 

AGGCAGACTT CAAAGCCTTC AAACCTATGT AACACAACAA CTAATCAGGG CTGCTGAAAT CAGGGCTTCT 

24440 24450 24460 24470 24480 24490 24500 

x Fnu4HI X 'Hindll 

X BspWI X DdeX X HincIX 

GCTAATCTTG CTGCTACTAA AATGTCTGAG TGTGTTCTTG GACAATCAAA AAGAGTTGAC TTTTGTGGAA 

24510 24520 24530 24540 24550 24560 24570 

> < NspI 

> < NspHI 

> < Nlalll 
X Maelll 

x Nlalll x MaeIX 

X MboII X FokI 

X Fnu4HI >< Bbsl BsaAI X 

X AcilX Bbvl x Afllll 

AGGGCTACCA CCTTATGTCC TTCCCACAAG CAGCCCCGCA TGGTGTTGTC TTCCTACATG TCACGTATGT 

24580 24590 24600 24610 24620 24630 24640 


x ScrFI 
X Mval 
x EcoRII 
X EC1136I 
X BstOI 
X BstNI 
X Mnll X BslI 
X DsaVX BsiYI 
x BsiLI 
X BsaJIX HphI 
X Apyl 


X HinPlI 
X Hin6I 
x Hhal 
X Haell 

X Cfol X Nlalll 

X Bspl43II X BspHI EcoNI X 

GCCATCCCAG GAGAGGAACT TCACCACAGC GCCAGCAATT TGTCATGAAG GCAAAGCATA CTTCCCTCGT 

24650 24660 24670 24680 24690 24700 24710 


X Mnll 

>< BslI x Tru9I 

>< BsiYI x Msel x Mnll 

GAAGGTGTTT TTGTGTTTAA TGGCACTTCT TGGTTTATTA CACAGAGGAA CTTCTTTTCT CCACAAATAA 

24720 24730 24740 24750 24760 24770 24780 

X Ddel x Tru9I 

X BsmAI X SfaNI 

X Sfcl X Alw26I X MselAlwI X 

TTACTACAGA CAATACATTT GTCTCAGGAA ATTGTGATGT CGTTATTGGC ATCATTAACA ACACAGTTTA 

24790 24800 24810 24820 24830 24840 24850 


>< Sau3AI 
>< Ndell 


FIGURE 13.57 
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>< Mbol 
>< DpnII 
X DpnX 
>< BspAI 
>< Bspl43I 


>< Plel 

>< Mnll > 

>< Ddel >< Hinfl 
>< BspWI > 

>< Alul > 


< Ksp632l 


Eamll04I 
Earl > < 


> < Scat 

> < Rsal 
>< MbolI 

>< Csp6I 
Alul > < Afal 


> < HphI 


TGATCCTCTG CAACCTGAGC TTGACTCATT CAAAGAAGAG CTGGACAAGT ACTTCAAAAA TCATACATCA 


24860 


24870 


24880 


24890 


24900 


24910 


24920 


>< Sau3AI 
>< Ndell 
>< Mbol 
>< MamI 
>< DpnII 
>< Dpnl 
>< BspAI 

>< Bspl43I 

X BsiBI >< Teu 9I >< Hindu 

X BsaBI >< Msel >< Hindi Acil >< 

CCAGATGTTG ATCTTGGCGA CATTTCAGGC ATTAACGCTT CTGTCGTCAA CATTCAAAAA GAAATTGACC 

24930 24940 24950 24960 24970 24980 24990 


>< Tru9I 

> < Tfil 


>< Mnll 
X EcoNI 
X BslI 

>< MnllX BsiYI 


X Swal 
X Msel 

> < Hinfl 
X Dral 


GCCTCAATGA GGTCGCTAAA AATTTAAATG 
25000 25010 25020 


AATCACTCAT TGACCTTCAA GAATTGGGAA AATATGAGCA 
25030 25040 25050 25060 


x Styl 
x Pall 
>< Haelll 
x EcoT14I 
X Ecol30I 


>< BsuRI 

X BssTlI Nlalll X 


X Tru9I>< BshI Maelll x 

X Msel X BsaJI X BstXI 

AT AT ATTAAA TGGCCTTGGT ATGTTTGGCT CGGCTTCATT GCTGGACTAA TTGCCATCGT CATGGTTACA 

25070 25080 25090 25100 25110 25120 25130 


> < SphI 

> < Pael 


X Spel 

> < Rmal 
x Nlalll 

> < Mael 


> < NspI 

> < NspHI 

> < Nlalll 

>< MnllX BbvT Fnu4HI x 


ATCTTGCTTT GTTGCATGAC TAGTTGTTGC AGTTGCCTCA AGGGTGCATG CTCTTGTGGT TCTTGCTGCA 

25140 25150 25160 25170 25180 25190 25200 


x Fokl 
>< Ddel 

X Mnll x Pletx Hinfl X BsrI 

AGTTTGATGA GGATGACTCT GAGCCAGTTC TCAAGGGTGT CAAATTACAT TACACATAAA CGAACTTATG 

25210 25220 25230 25240 25250 25260 25270 

x Sau3AI 
X Ndell 
X Mbol 
>< DpnII 
> < Dpnl 

FIGURE 13.58 
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>< BspAX 






> 

< Bspl4 31 






>< Bsgl 

>< Alwl X BsrI 

BspWI > 

GATTTGTTTA TGAGATTTTT 

TACTCTTGGA 

TCAATTACTG 

CACAGCCAGT 

AAAAATTGAC 

AATGCTTCTC 

25280 

25290 

25300 

25310 

25320 

25330 

25340 

>< 

Seal 






>< 

Rsal 






>< Csp6I >< 

Sfcl 





>< 

Afal >< 1 

Hlalll 

X Acil 


X Mali 

FokI > 

CTGCAAGTAC 

TGTTCATGCT 

ACAGCAACGA 

TACCGCTACA 

agcctcactc 

CCTTTCGGAT 

GGCTTGTTAT 

25350 

25360 

25370 

25380 

25390 

25400 

25410 



> 

< HinPlI 






> 

< Hin6I 







>< Hhal 



Rmal >< 




>< Haell 

x HinPlI 

Nhel >< 




>< Eco47III x Hin6X 

Mael >< 




X Cfol 

X 

Hhal ' Fnu4HI X 


>< BspWI 

x Bspl43II X 

Cfol 

Alul x 

TGGCGTTGCA 

TTTCTTGCTG 

TTTTTCAGAG 

CGCTACCAAA 

ATAATTGCGC 

TCAATAAAAG 

ATGGCAGCTA 

25420 

25430 

25440 

25450 

25460 

25470 

25480 

>< EcoNX 






>< 

BslI 






>< 

BsiYI 



x Maelll 


x Bbvl >< BsrI >< Bbvl > 

< Fnu4HI 


Bbvl X 

GCCCTTTATA 

AGGGCTTCCA 

GTTCATTTGC 

AATTTACTGC 

TGCTATTTGT 

TACCATCTAT 

TCACATCTTT 

25490 

25500 

25510 

25520 

25530 

25540 

25550 







Zsp2I x 






PpulOI x 

> 

< SfcX 

X HinPlI 



Nsil x 


x PstI 

x Hin6l x Rsal 

Mphll03I X 

> 

< Fnu4HI 

x Hhal x Csp6I 


EcoT22I x 

X BspMT 

x Mnll 

x Cfol x Afal x Mnll Avalll >< 

TGCTTGTCGC 

TGCAGGTATG 

GAGGCGCAAT 

TTTTGTACCT 

CTATGCCTTG 

ATATATTTTC 

TACAATGCAT 

25560 

25570 

25580 

25590 

25600 

25610 

25620 

>< SfaNI 






>< 

NspI 






>< 

NspHI 






X 

Nlalll 





X SfaNI 

CAACGCATGT 

AGAATTATTA 

TGAGATGTTG 

GCTTTGTTGG 

AAGTGCAAAT 

CCAAGAACCC 

ATTACTTTAT 

25630 

25640 

25650 

25660 

25670 

25680 

25690 





X 

Bstll07I 






x AccI Maelll x 

GATGCCAACT 

ACTTTGTTTG 

CTGGCACACA 

CATAACTATG 

ACTACTGTAT 

ACCATATAAC 

AGTGTCACAG 

25700 

25710 

25720 

25730 

25740 

25750 

25760 







X MboII 




X HphI 


BstXI X 

>< Muni 

X Maelll 

x Maelll 

X Eco57I 

>< Bbsl Mnll > 

ATACAATTGT 

CGTTACTGAA 

GGTGACGGCA 

TTTCAACACC 

AAAACTCAAA 

GAAGACTACC 

AAATTGGTGG 

25770 

25780 

25790 

25800 

25810 

25820 

25830 


>< Rsal 

> < Niairr 

>< HphI 

>< Tru9I x Tthlllix Csp6l 
>< Ddel >< Ddel >< MseIX AspI >< Afal 

FIGURE 13.59 
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TTATTCTGAG GATAGGCACT CAGGTGTTAA AGACTATGTC GTTGTACATG GCTATTTCAC CGAAGTTTAC 

25840 25850 25860 25870 25880 25890 25900 


Tru9I X 

> < Hinflx Plel >< BsrI Msel X 

>< Alul >< AccI >< Sfcl >< AlwNI >< MboII HindXXI > 

TACCAGCTTG AGTCTACACA AATTACTACA GACACTGGTA TTGAAAATGC TACATTCTTC ATCTTTAACA 
25910 25920 25930 25940 25950 25960 25970 


> < TthHB8I 


X Tru9I 


> < TaqI 


X Ksp632I 


X Msel > < MboII X Earl BspWI >< 

>< Alul >< Eco57I x Eamll04I Alwl >< 

AGCTTGTTAA AGACCCACCG AATGTGCAAA TACACACAAT CGACGGCTCT TCAGGAGTTG CTAATCCAGC 

25980 25990 26000 26010 26020 26030 26040 


>< XhoII 
>< Sau3AI 
X NlalV 
>< Ndell 
>< Mfll 
>< Mbol 
>< DpnII 
x Dpnl 


>< BstYI 
>< BstI 


>< BspAI 
X Bspl43I 

>< BscBI >< Rmal 

>< BamHI >< Alwl >< Mael 


Rsal x 
Csp6I >< 
Afal X 


AATGGATCCA ATTTATGATG AGCCGACGAC GACTACTAGC GTGCCTTTGT AAGCACAAGA AAGTGAGTAC 
26050 26060 26070 26080 26090 26100 26110 


> 

>< 


GAACTTATGT 

26120 


> < Tru9l 
>< Rsal 

> < Msel 
X MboII 

< Rsal X Maell x Rsal 

Csp6I >< Csp6I X Tru9I X Csp6I 

< Afal X Afal x Msel >< Afal 

ACTCATTCGT TTCGGAAGAA ACAGGTACGT TAATAGTTAA TAGCGTACTT CTTTTTCTTG 

26130 26140 26150 26160 26170 26180 


X TthHB8I 


>< TaqI 

x Rmal x HinPlI > < Rsal 

> < Maelll x Hin6l Fnu4HI >< 

x Mael >< Rmal x Hhal >< Csp6I 

>< FolcI >< Mael >< Cfol x Bbvl > < Afal 

CTTTCGTGGT ATTCTTGCTA GTCACACTAG CCATCCTTAC TGCGCTTCGA TTGTGTGCGT ACTGCTGCAA 

26190 26200 26210 26220 26230 26240 26250 


>< Tru9I 
>< Msel 

x Sspl x Maell 
x Hpal 
>< Hindu 
>< Hindi 

TATTGTTAAC GTGAGTTTAG TAAAACCAAC 
26260 26270 26280 


X Tru9I 
>< Thai 
>< MvnI 

>< Msel 

>< BstOI Ksp632I > 

>< Maell >< BspSOI x MboII Earl > 
X AccI >< AccII Eamll04I > 

GGTTTACGTC TACTCGCGTG TTAAAAATCT GAACTCTTCT 
26290 26300 26310 26320 


FIGURE 13.60 
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>< Sau3AI 
>< Ndell 
>< Mbol 
>< DpnII 
>< Mbolix Dpnl 

>< XmnI X BspAI> < Eco57I >< Tru9X 

>< Asp700lx Bspl43I >< MseX 

GAAGGAGTTC CTGATCTTCT GGTCTAAACG AACTAACTAT TATTATTATT CTGTTTGGAA CTTTAACATT 

26330 26340 26350 26360 26370 26380 26390 


>< ScrFI 
>< Mval 


>< EcoRII 
>< EC1136I 
>< DsaV NlalV >< 


>< Rsal 

>< Mnll 


>< BstOI 

>< Tru9X >< BstNX Rmal >< 


>< Csp6I >< Msel >< BsiLI Mael >< 

> < Nlalll >< Afal > < Alul X ApylBscBI X 

GCTTATCATG GCAGACAACG GTACTATTAC CGTTGAGGAG CTTAAACAAC TCCTGGAACA ATGGAACCTA 

26400 26410 26420 26430 26440 26450 26460 


X ScrFI 
>< Rmal 

X Mval 
X Mae! 

X EcoRII 
X Ecll36I 
X DsaV 
X BstOI 
X BstNI 
X BsiLI 

x Apyl >< Maelll 

GTAATAGGTT TCCTATTCCT AGCCTGGATT ATGTTACTAC AATTTGCCTA TTCTAATCGG AACAGGTTTT 

26470 26480 26490 26500 26510 26520 26530 

X Pall 
X MscI 

>< Mnll x MaeIII 
X Haelll 
X Eael 
X BsuRI 
x BsrI 
X BspWI 

X HindiII • X BshI 

>< Alul x Ball x Bbvl Fnu4HI X 

AAAGCTTGTT TTCCTCTGGC TCTTGTGGCC AGTAACACTT GCTTGTTTTG TGCTTGCTGC 

26550 26560 26570 26580 26590 26600 

x VspI 
X Tru9I 

X Msel X HphI 

>< Sfcl X Asnl X BsrI 

X AccI >< Aselx Maelllx Acil 

TGTCTACAGA ATTAATTGGG TGACTGGCGG GATTGCGATT GCAATGGCTT GTATTGTAGG CTTGATGTGG 

26610 26620 26630 26640 26650 26660 26670 


X Rsal 
X Csp6I 
X Afal 
TGTACATAAT 
26540 


>< EspI 

>< Eco57I 
X Ddel 

>< Celll x Rsal 

>< Bpull02I x Csp6I 

FIGURE 13.61 
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>< BfrI >< Afal 

>< Alul >< Acil MboII > 

CTTAGCTACT TCGTTGCTTC CTTCAGGCTG TTTGCTCGTA CCCGCTCAAT GTGGTCATTC AACCCAGAAA 

26680 26690 26700 26710 26720 26730 26740 


X ScrFI 
>< Neil 
>< MspI 
>< Hpall 
>< HapII 
>< DsaVX Mali 
X BslI 
X BsiYI 

X BsaJI >< Muni > < Xcml 

x Beni >< Maelll >< Acil x Nlalll 
CAAACATTCT TCTCAATGTG CCTCTCCGGG GGACAATTGT GACCAGACCG CTCATGGAAA GTGAACTTGT 

26750 26760 26770 26780 26790 26800 26810 


Tru9I >< 

SinI > 
Sau96I > 
PpuMI > 
NspIV > 
Msel >< 



>< Sau3AI 



> 


>< Ndell 


>< Pall 

> 


>< Mbol 


x MspI 



X Fbal 


>< Hpall 

>< 


>< DpnII 


>< HapII 

>< 


X Dpnl 


x Haelll 

>< 


>< BspAI 


x Gdill 

>< 


>< Bspl43I 


>< Eael 

>< 


X BsiQI 


>< BsuRI 

>< 


X Bell X 

Maelll 

>< BshI 

>< 

CATTGGTGCT 

GTGATCATTC GTGGTCACTT 

GCGAATGGCC GGACACTCCC 

26820 

26830 

26840 

26850 

26860 


x Maelll 

< Rmal X Haell 

< MaeI * EcoO109I > 

>< HinPlIEco47I > 
StylX Hin6I Drall > 
EcoT14I . Cfr131 > 
Ecol30I>< Bspl43II 
BssTlI BsiZI > 

BsaJI Bmel8I > 

Blnl >< Hhal Avail > 
AvrII X Cfol Asul > 
TAGGGCGCTG TGACATTAAG 
26870 26880 


X Sau3AI 
>< Ndell 
X Mbol 
>< DpnII 
x Dpnl 

>< PssI >< BspMI 

X Psp5II >< BspAI x XranI 

>< NspHII x Bspl43I >< Asp700I > < Hgal Fnu4HI >< 

GACCTGCCAA AAGAGATCAC TGTGGCTACA TCACGAACGC TTTCTTATTA CAAATTAGGA GCGTCGCAGC 

26890 26900 26910 26920 26930 26940 26950 


x Tfil 
X Hinfl 


x Bbvl 


> < Tru9I 


X Bbvl x Fnu4HI x Acil > < Msel 

GTGTAGGCAC TGATTCAGGT TTTGCTGCAT ACAACCGCTA CCGTATTGGA AACTATAAAT TAAATACAGA 

26960 26970 26980 26990 27000 27010 27020 


X MspI 


>< Rsal 

X Hpall 


x Rmal 

X HapII 


>< Csp6I 

X CfrlOI 


x Maelx Bcgl 

>< Bcgl/a 

x SspI 

>< Afal >< 


Hindll x 
Hindi >< 


FIGURE 13.62 
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CCACGCCGGT AGCAACGACA ATATTGCTTT GCTAGTACAG TAAGTGACAA CAGATGTTTC ATCTTGTTGA 

27030 27040 27050 27060 27070 27080 27090 


>< ScrFI 
>< Mval 
>< Maelll 
>< EcoRII 
X EC1136I 
>< DsaV 
>< BstOX 
>< BstNI 

>< BsiLI X TfiX 

>< Apyl >< Mnll Hinfl >< 

CTTCCAGGTT ACAATAGCAG AGATATTGAT TATCATTATG AGGACTTTCA GGATTGCTAT TTGGAATCTT 

27100 27110 27120 27130 27140 27150 27160 

>< BsmAI >< Tru9I > < Mall 

>< Maell >< Alw26I >< Msel >< Ddel >< MboII 

GACGTTATAA TAAGTTCAAT AGTGAGACAA TTATTTAAGC CTCTAACTAA GAAGAATTAT TCGGAGTTAG 

27170 27180 27190 27200 27210 27220 27230 

>< Ksp632I 

>< MboII >< Earl 

>< MboII >< NlaIIIEamll04I x 

ATGATGAAGA ACCTATGGAG TTAGATTATC CATAAAACGA ACATGAAAAT TATTCTCTTC CTGACATTGA 

27240 27250 27260 27270 27280 27290 27300 

> < Rsal >< Rsal 
>< Csp6I >< Csp6I 
> < Alul >< Mnll > < Afal >< Afal 

TTGTATTTAC ATCTTGCGAG CTATATCACT ATCAGGAGTG TGTTAGAGGT ACGACTGTAC TACTAAAAGA 

27310 27320 27330 27340 27350 27360 27370 

>< Mnll X HphI >< HphI X Mnll 

ACCTTGCCCA TCAGGAACAT ACGAGGGCAA TTCACCATTT CACCCTCTTG CTGACAATAA ATTTGCACTA 

27380 27390 27400 27410 27420 27430 27440 


>< TthHB8I 
>< TaqI 
>< Rsal 


Sau3AI > 

> < PvuII 

> < Psp5I 

> < NspBII 

Ndell > 
Mbol > 
>< Fnu4HI 


>< Csp6I 

>< Rmal >< Bbvl 

>< Mael >< Afal > 

ACTTGCACTA GCACACACTT TGCTTTTGCT TGTGCTGACG GTACTCGACA TACCTATCAG 
27450 27460 27470 27480 27490 27500 


DpnII > 
BspAI > 
< Alul 
CTGCGTGCAA 
27510 


>< SstI 
>< Sdul 
>< Sacl 
>< MspII 
>< HglAI 
>< Eco24I 
> < Ecll36II 

>< BspWI 




>< Bspl286I 



>< Bmyl 

>< HphI 


X Banll 

X Dpnl 

X Mali 

>< Alw21I 


FIGURE 13. 63 
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>< Bspl43I >< Mnll > < AluX Bbvl >< 

GATCAGTTTC ACCAAAACTT TTCATCAGAC AAGAGGAGGT TCAACAAGAG CTCTACTCGC CACTTTTTCT 

27520 27530 27540 27550 27560 27570 27580 


SstI >< 
Sdul >< 
SacI >< 
NspII >< 
HgiAI >< 
Eco24I >< 
Ecll36II >< 
Bspl286I >< 
Bmyl X 



X Rina I 

X Tru9I 




Banll x 


X Mael 

x Msel 


X Tru9I 


Alw21I x 

>< 

Fnu4HI 

>< 

HphI 

>< Msel 


Alul >< 

CATTGTTGCT 

GCTCTAGTAT 

TTTTAATACT 

TTGCTTCACC 

ATTAAGAGAA 

AGACAGAATG 

AATGAGCTCA 

27590 

27600 

27610 

27620 

27630 

27640 

27650 

X Tru9I 





X Tru9I 


x Msel 





X Msel 


CTTTAATTGA 

CTTCTATTTG 

TGCTTTTTAG 

CCTTTCTGCT 

ATTCCTTGTT 

TTAATAATGC 

TTATTATATT 

27660 

27670 

27680 

27690 

27700 

27710 

27720 


x XhoIX 
X Xbal 

> < SceFI 

>< Sau3AI 
x Rina I 
x Ndell 

> < Mval 

X Mfll 
X Mbol 


x EcoRIIx Mael 

> < Eel136I 

x Dpall 
>< Dpnl 
X BstYI 

> < BstOI 

> < BstNI 

>< TthHB8I x BspAI > < Rsal 

x DsaVx Bspl43I >< MboII 

> < BsiLI X Csp6I 

x Taql > < Apyl > < Alwl > < Afal >< Nlalll 

TTGGTTTTCA CTCGAAATCC AGGATCTAGA AGAACCTTGT ACCAAAGTCT AAACGAACAT GAAACTTCTC 

27730 27740 27750 27760 27770 27780 27790 


X HinPlI 
X Hin6I 
>< Hhal 

>< Rsal x Haell 
>< Sfcl X Eco47III 

>< Csp6I>< Cfol SfaNI >< 

>< Ndel x Afal x Bspl43II 

ATTGTTTTGA CTTGTATTTC TCTATGCAGT TGCATATGCA CTGTAGTACA GCGCTGTGCA TCTAATAAAC 


27800 27810 

27820 

27830 

27840 

27850 

27860 

>< XhoII 
x Sau3Al 
x Ndell 
> < Mali 

X Mfll 







FIGURE 13.64 
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>< Mbol 
>< DpnII 

>< Dpnl x Rsal 

>< BstYI >< MbolI 

>< Nlallix BspAI >< Csp6l >< Rmal 

>< Alwl >< Bspl43I >< Afal >< Mael 


CTCATGTGCT 

TGAAGATCCT TGTAAGGTAC 

AACACTAGGG 

GTAATACTTA TAGCACTGCT 

TGGCTTTGTG 

27870 


27880 27890 


27900 


27910 

27920 

27930 

>< Sdul 










>< Rmal 










>< NspII 










>< Mael 










>< HgiAI 










>< Bspl286I 






>< 

NspI 


>< Bmyl 







>< 

NspHI 


X Alw211 







X 

Nlalll 

X Maelll 

CTCTAGGAAA 

GGTTTTACCT TTTCATAGAT 

GGCACACTAT 

GGTTCAAACA TGCACACCTA 

ATGTTACTAT 

27940 


27950 27960 


27970 


27980 

27990 

28000 

> 

< 

XhoII 








> 

< 

Sau3AI 

> < Van91I 




>< Rsal 





>< 

PvuII 




>< NlalV 





>< 

Psp5I 




>< Kpnl 

x Nlalll 

> 

< 

Ndell 

> < PflMI 




X Eco64I 

X 

Maelll 

> 

< 

MfllX 

NspBII 




>< Csp6I>< 

HphI 


> 

< 

DpnII 

>< HinPlI 



>< BscBI 

>< 

Eco0651 


x Bspl431 x Hin6I 



X BanI X 

BspHI 


> 

< 

BstYI 

> < BslI X 1 

Hhal 

X Rmal 

>< Asp718 

X 

Eco91I 

> 

< 

BspAI 

> < BsiYIX ( 

Cfol 

X Mael 

>< Afal 

>< 

BstPI 

> 

< 

MboIX 

Alulx BspWI 

>< 

BspWI 


X AccBlI 

>< 

BstEII 

x Alwl : 

x Dpnl 

> < AccB7I 


X Alul 

>< Acc65I 

X Bbvl 

CAACTGTCAA 

GATCCAGCTG GTGGTGCGCT 

TATAGCTAGG 

TGTTGGTACC TTCATGAAGG 

TCACCAAACT 

28010 


28020 28030 


28040 


28050 

28060 

28070 


>< Fnu4HI 
X Esp3I 
>< BsmAX 
>< Alw26I 


>< Rsal 
X Maell 
>< Csp6I 
>< BsmBI 
>< Afal 


x Tru9I 
>< MseX 
>< Dral 


>< 

>< 


Tru9I 

MseX 


>< SinI 
>< Sau96I 
>< NspIV 
NspHII >< 

NlalV >< 

>< Eco47I 
X Cfr!3I 
>< BsiZX 
BscBI >< 

X Bmel8I 
X Avail 
>< Asul 


GCTGCATTTA GAGACGTACT TGTTGTTTTA AATAAACGAA CAAATTAAAA TGTCTGATAA TGGACCCCAA 

28080 28090 28100 28110 28120 28130 28140 


>< Sdul 
>< NspII 
>< Bspl286I 
>< Bmyl 

>< Maell >< Acil 


>< SinI 
>< Sau96I 
>< NspIV 
>< NspHII 
>< NlalV 
>< Eco4 71 
X Cfrl3I 
>< BsiZI 
X BscBI 
>< Bmel8I 
X Avail >< Tfil 
>< Asul >< Hinfl 

FIGURE 13.65 
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tcaaaccaac gtagtgcccc ccgcattaca tttggtggac ccacagattc aactgacaat aaccagaatg 

28150 28160 28170 28180 28190 28200 28210 

>< HinPlI >< Styl 
>< Haell 

> < Pall >< Hin6I >< EcoT14I 

> < Haelll >< Hhalx Ecol30I 

>< BspWI >< BssTlI 

> < BsuRI >< Bspl43II 

>< Hgal> < BshI >< Cfolx BsaJI x Hgal 

GAGGACGCAA TGGGGCAAGG CCAAAACAGC GCCGACCCCA AGGTTTACCC AATAATACTG CGTCTTGGTT 

28220 28230 28240 28250 28260 28270 28280 

X TthHB8I 

> < ScrPI 
x Pall 

X PaeR7I 
X NspIII 

> < MvaI 
X Haelll 
>< EcoRII 

x Eco88I 

x Xhol > < EC1136I 
x DsaV 
>< BsuRI 

x Slal > < BstOI 
X MnllX Taql> < BstNI 
x Ccrl > < BsiLI 
X Hinfl >< BshI 

X TfilX BcoIX BsaJI 
x Mali x Ddel >< Aval > < Apyl 

X Alul X Ddel > < Nlalll X BfrI X Ama87I X Mnll 

CACAGCTCTC ACTCAGCATG GCAAGGAGGA ACTTAGATTC CCTCGAGGCC AGGGCGTTCC AATCAACACC 

28290 28300 28310 28320 28330 28340 28350 

>< SinI 
>< Sau96I 
X NspIV 
X NspHII 
X Eco47I 
x Cfrl3I 
X BsiZI 

x Bmel8I > < Ksp632I 

>< Avail > < Eamll04I 

>< Asul > < Earl > < AluIX MboII >< Maelll 

AATAGTGGTC CAGATGACCA AATTGGCTAC TACCGAAGAG CTACCCGACG AGTTCGTGGT GGTGACGGCA 

28360 28370 28380 28390 28400 28410 28420 

X Ssti 
>< Sdul 
x SacI 
>< NspII 
x HgiAI 
x Espl 
X Eco24I 
X EC1136II 
x Ddel 
x CellI 
x Bspl286I 
X Bpull02I 
>< Bmyl 
>< Banll 

FIGURE 13.6 6 


x SauS6I 

x Styl >< Pall 

>< Rraal x NspIV 
x Mael X Haelll 

x EcoT141 >< Cfrl3I 
X Ecol30I >< BsuRI 

X BssTlI > < BsrI 

X Rsal x BsaJI >< BsiZI 
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>< Alw21I >< Csp6I >< BlnX >< Bshlx Hindlll 

>< HphI >< Alul >< Afal X AvrXI >< Asul X Alul 

AAATGAAAGA GCTCAGCCCC AGATGGTACT TCTATTACCT AGGAACTGGC CCAGAAGCTT CACTTCCCTA 

28430 28440 28450 28460 28470 28480 28490 

X HinPlI 
x Hin6I 
X Hhal 
X Ha'ell 

X Cfol > < Mnll X NlalV 

>< Bspl43II >< SfaNI x Ddel >< BscBI 

CGGCGCTAAC AAAGAAGGCA TCGTATGGGT TGCAACTGAG GGAGCCTTGA ATACACCCAA AGACCACATT 

28500 28510 28520 28530 28540 28550 28560 

X NlalV 
X Eco64I 
X BscBI 
x BanI 

X Acil 

X AccBlI X Bbvl >< Fnu4HI >< Mnll 

GGCACCCGCA ATCCTAATAA CAATGCTGCC ACCGTGCTAC AACTTCCTCA AGGAACAACA TTGCCAAAAG 

28570 28580 28590 28600 28610 28620 28630 

>< Thai 
x Mnll 

X Maell >< MvnI 
>< Mnll BstUI >< 

X Fnu4HI >< Ksp632I BspSOI >< 

X BspWI >< Earl X BsaAIx Acil 

x Mnll >< Mnll >< Aciix MboII >< Eamll04I AccII >< 

GCTTCTACGC AGAGGGAAGC AGAGGCGGCA GTCAAGCCTC TTCTCGCTCC TCATCACGTA GTCGCGGTAA 

28640 28650 28660 28670 28680 28690 28700 


X ScrFI 


X Mval 
X EcoRII 
X Ecll36I 
x DsaVX Fnu4HI 
X BstOI 
X BstNI 
X BsiLI 

x Apyl >< Bbvl 

TTCAAGAAAT TCAACTCCTG GCAGCAGTAG GGGAAATTCT 
28710 28720 28730 28740 


>< TthHB8I 

x Rmal 
x Nhel 
X Mnll 
X Mael 
> < BspWI 

X TaqI X Acil 

CCTGCTCGAA TGGCTAGCGG AGGTGGTGAA 
28750 28760 28770 


> < Thai 

> < MvnI 

>< HphI >< Mnll 

> < HinPlI 

> < Hin6I 


x Hhal 


> 

< BstUI 

x Rmal 



Pall 

>< 

> 

< Bsp50I 

>< Mael 



Haelll 

X 

>< Bbvl 

X CfoIX 

Fnu4HI 



BsuRI 

>< 

> 

< AccIIX 

BspWI 

>< 

Alul 

BshI 

>< 

ACTGCCCTCG 

CGCTATTGCT 

GCTAGACAGA 

TTGAACCAGC 

TTGAGAGCAA 

AGTTTCTGGT AAAGGCCAAC 

28780 

28790 

28800 

28810 

28820 

28830 

28840 


Rsal X 
>< Mnll 
MaelI X 
Csp6I X 

FIGURE 13.6 7 


> < Palix Maelll 

> < Haelll >< Fnu4HI 

> < BsuRI >< Ddel >< Ddel 
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> < BshI > < Bbvl >< Mnll >< BspWI >< SfaNI Afal >< 

aacaacaagg ccaaactgtc actaagaaat ctgctgctga ggcatctaaa aagcctcgcc aaaaacgtac 

28850 28860 28870 28880 28890 28900 . 28910 

>< Tthllll 
>< SinI 
>< Sau96I 
>< NspIV 
>< NspHII 
> < Maell 


>< Eco47I 
>< Cfrl3I 
>< BsmBI 



>< Rsal 




X BsiZI 

X Styl 


>< 

Maelll 



X Bmel8I 

X EcoT14I 


X Maell 

>< 

Esp3I 

X Avail 

>< Ecol30I 


X Csp6I 


>< 

BsmAI 

X Asul 

x BssTlI 


X Afal 


>< 

Alw26I> 

< AspI 

X BsaJI 

TGCCACAAAA 

CAGTACAACG 

TCACTCAAGC 

ATTTGGGAGA 
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Serologie SRAS : Technique N Indirect (lere serie) 
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Serologie SRAS : Technique N Indirect (2eme serie) 
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FIGURE 15 



















Serofogie SRAS : Technique Double Epitope (lere serie) 
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Serologie SRAS : Technique Double Epitope (2eme serie) 
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FIGURE 18 
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FIGURE 19 
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